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Zusammenfassung 


Die Versorgungsforschung („health services research“) hat sich in Deutschland und international be- 
reits als vielfältige Disziplin mit komplexem, transdisziplinärem Charakter etabliert. Die Fragestellun- 
gen der Versorgungsforschung umfassen neben der deskriptiven und Inferenz-orientierten Analyse 
entlang der drei Versorgungsqualitätsdimensionen (Strukturen, Prozesse und Outcomes) auch die Ver- 
sorgungskonzeption und das Versorgungsmanagement, und somit auch die Implementierung und die 
Evaluation von Interventionen. Unabdingbare Voraussetzungen für die aussagekräftige Beantwortung 
aller dieser Fragen, vor allem vor dem Hintergrund der „doppelten Komplexität“ (d.h. komplexe Inter- 
ventionen mit komplexen Kontextbedingungen), sind das Vorhandensein und die Zugänglichkeit von 
umfassenden Daten hoher Qualität. 

Vor dem Hintergrund der dynamischen Landschaft der unterschiedlichen Datengrundlagen, die für die 
Versorgungsforschung von Nutzen sein könnten, und der zunehmenden Wichtigkeit von Fragestellun- 
gen, für deren Beantwortung ein breites Spektrum an Informationen erforderlich ist, ist davon auszu- 
gehen, dass die Versorgungsforschung in den kommenden Jahren auf der Verlinkung (Datenlinkage, 
„data linkage“), also der Verknüpfung mehrerer Datenquellen auf Basis von geeigneten gemeinsamen 
Schlüsselvariablen angewiesen sein wird. Die Datenquellen beinhalten Routinedaten, verbunden mit — 
oder verknüpfbar mit — klinischen Daten und weiteren, teils unstrukturierten Alltags- und Kontextda- 
ten. Der Anspruch an Daten auf hohe Validität, Vollständigkeit, Aktualität, Repräsentativität und Qua- 
lität soll davon unberührt bleiben. 

In Deutschland werden umfassende Daten hoher Qualität routinemäßig gesammelt, allerdings sind 
diese für Forschungszwecke nur bedingt geeignet und eingeschränkt verfügbar. Es bestehen viele Da- 
tenbestände nebeneinander, die jedoch stark fragmentiert sind. Mit dem Digitale-Versorgung-Gesetz 
(DVG) soll die Nutzbarkeit der GKV-Routinedaten für Forschungszwecke auf der Grundlage der §§ 
303a-e SGB V verbessert werden, die Umsetzung steht jedoch aus. 


Das Gutachten ist parallel zum DVG im Jahr 2019 entstanden und entspricht inhaltlich dem damaligen Stand 
(Ende 2019). Es war geplant, es in Veranstaltungen einer breiteren (Fach-)Offentlichkeit zu präsentieren und mit 
dieser zu diskutieren. Die Corona-Krise hat dies nicht nur organisatorisch vereitelt, sondern auch andere (For- 
schungs-)Prioritäten geschaffen. Aber die Coronakrise hat auch den Bedarf nach zeitnahen Informationen zu 
Gesundheit und Gesundheitsversorgung exponentiell zunehmen lassen. Seit März 2020 gibt es Corona- 
Tagesberichte des RKI - vorher gab es noch nicht einmal Jahresberichte zur gesundheitlichen Situation, sondern 
Daten zu Todesursachen, Krankenhausfällen etc. wurden Jahre nach dem Zeitraum, auf den sie sich beziehen, 
veröffentlicht (2020 z.B. die Daten zu Hospitalisierungen im Jahr 2018) und standen zusammenhangslos neben- 
einander — und viele Daten, etwa zu freien bzw. verfügbaren Betten existierten gar nicht. Jetzt müssen Kranken- 
häuser täglich ihre intensivmedizinische Bettenbelegung an das Intensivregister melden und alle paar Monate die 
Daten zu allen Krankenhausbehandlungen an das InEK, das sie zeitnah zur wissenschaftlichen Analyse zur Ver- 
fügung stellt. Dies zeigt, dass dies möglich ist — und das politische und öffentliche Interesse wird dies auch in 
Zukunft einfordern. Die Inhalte des Gutachtens erscheinen den AutorInnen daher noch wichtiger als vorher; sie 
haben sich daher entschlossen, das Gutachten nunmehr im Frühjahr 2021 in fast unveränderter Form zu veröf- 
fentlichen. Lediglich die Ausführungen zur elektronischen Patientenakte und ihrer Nutzung zu Forschungszwe- 
cken wurden entsprechend des Patientendaten-Schutzgesetzes aktualisiert. 


Im internationalen Vergleich ist erkennbar, dass im Ausland zum Teil vielfältigere, validere und ver- 
allgemeinerbare Erkenntnisse aufgrund besserer Datenzugänglichkeit erzielt werden können. Daher 
liegt der Ursprung dieses Gutachtens in den Grundfragen, welche Fragestellungen der Versorgungs- 
forschung im Ausland auf Basis besserer Daten besser beantwortet werden können, und auf welchen 
Wegen eine solche Verbesserung der Datengrundlage in Deutschland erzielt werden könnte. 
Fallbeispiele interessanter Verlinkungsansätze wurden identifiziert und anhand eines vordefinierten 
Konzeptes analysiert. Um die Stichprobe der Vergleichsländer für das Gutachten auszuwählen, wur- 
den drei Hauptkriterien zugrunde gelegt: eine Mischung aus Gesundheitssystemstrukturen; ein Spekt- 
rum bezüglich der Datenverfügbarkeit und -nutzung; und bekannte interessante Beispiele relevanter 
Initiativen. Für die Analyse der identifizierten Fallstudien aus dem internationalen Vergleich wurde 
ein Konzept entwickelt, welches zwischen Datenbeständen mit versorgungsrelevanten Daten i) auf 
Individualebene und Daten auf Nicht-Individualebene und ii) aus drei bzw. vier großen inhaltlichen 
Blöcken (Gesundheitsdaten, Gesundheitsversorgungsdaten, soziodemographischen bzw. ókonomi- 
schen Daten, Umweltdaten) unterscheidet. Informationen wurden für alle Vergleichsländer bzw. Fall- 
studien zunächst auf Basis von Öffentlich zugänglichen Quellen identifiziert. Anschließend wurde pro 
Land ein Profil erstellt und geeigneten Länderexperten zur Validierung und Ergänzung weitergeleitet. 
Das Gutachten stellt eine Übersicht der eingeschlossenen Fallstudien vor (Kapitel 3), sowie im An- 
hang wichtige Eckdaten pro Land und Fallstudie. Es folgen eine nähere Betrachtung der Möglichkei- 
ten der Nutzung von Routinedaten (Kapitel 4), der Verlinkungsmöglichkeiten mit und ohne eindeuti- 
ges personenbezogenes Merkmal (Kapitel 5), der unterschiedlichen Zugriffswege für Forscher (Kapi- 
tel 6), der Ausgestaltung des Einsatzes von Daten aus elektronischen Patienten- bzw. Gesundheitsak- 
ten für die Forschung (Kapitel 7) und ein Zwischenfazit (Kapitel 8). Das Gutachten endet mit einer 
Wunschliste für mögliche regulatorische Änderungen in Anbetracht der aktuellen politischen Diskus- 
sion (Kapitel 9). 

Die dargestellten Fallstudien lassen sich grob in fünf Kategorien einteilen: 

i) große administrative Datensätze, die es aufgrund der zentralen Zulaufstelle ermöglichen, 
Fragen über den Versorgungsprozess einzelner Patienten sektorenübergreifend abzubilden 
und Möglichkeiten zur Verlinkung mit anderen Daten aufweisen (z.B. MBS/PBS in Aust- 
ralien, NHIS/HIRA in Südkorea, ÖGIS in Österreich, CMS in den Vereinigten Staaten); 

ii) zentrale Stellen, die vorhandene Datenbestände unterschiedlicher Datenhalter und mit va- 
riablem Inhalt zusammenführen; hier zeichnen sich zwei Möglichkeiten aus: die Daten 
bleiben bei den Datenhaltern und werden auf Antrag verknüpft (z.B. PHRN in Australien, 
SDLE in Kanada, eDRIS in Schottland) oder in einer konsolidierten Datenbank aufgeho- 
ben (z.B. IDI in Neuseeland); 

111) Datenbestände, in denen routinemäßig erhobene Daten zusammengeführt und für Kliniker 
und Forscher zur Verfügung gestellt werden (z.B. CPRD in England, Nivel PC Database 


in den Niederlanden, Kaiser Health Connect in den Vereinigten Staaten); 


iv) elektronische Plattformen, die es (unter anderem) Patienten erlauben, Zugriff auf ihre ei- 
genen Informationen zu gewinnen und die ggf. als potentielle Grundlage für klinische Da- 
ten für die Forschung betrachtet werden könnten (z.B. ELGA in Österreich, myHR in 
Australien bzw. Sundhed.dk in Dänemark, Journalen in Schweden); 

v) Tools, die die Forschung über mehrere Datensätze hinweg erleichtern (z.B. RKKP in Dä- 
nemark, Registerforsking in Schweden). 

Drei der Fallstudien heben die Möglichkeit hervor, für Forschungsfragen auf vorhandene, integrierte 
Routinedaten zurückzugreifen. Damit sind Datensätze gemeint, welche bereits für den primären Nut- 
zungszweck in einer integrierten (verknüpften) Form über mehrere Leistungsbereiche erstellt werden. 
Ein aus Deutschland vergleichbares Beispiel sind dabei die Datensätze, welche den Krankenkassen auf 
Grundlage der Abrechnungsdaten vorliegen. Diese sind auf Versichertenebene, liegen über mehrere 
Jahre vor und decken verschiedene Leistungsbereiche ab. In Australien, Südkorea sowie den USA 
konnten Möglichkeiten der Datennutzung von integrierten Routinedaten identifiziert werden. Es han- 
delt sich dabei in allen Ländern um Datensätze, welche sich überwiegend aus Abrechnungsdaten 
(Claimsdata) zusammensetzen. 

Es ist ersichtlich, dass eine gute Datengrundlage für Forschungszwecke vor allem dann vorliegt, wenn 
alle Informationen zur Interaktion von einzelnen Patienten mit dem Gesundheitssystem an einer zent- 
ralen Stelle gehalten werden; so können leistungserbringer- und ggf. sektorenübergreifende Versor- 
gungsprozesse abgebildet werden, im optimalen Fall auch im Zeitverlauf. Diese Bedingung ist grund- 
sätzlich in Gesundheitssystemen erfüllt, die ein „Gatekeeping“-System in der Primärversorgung ver- 
ankert haben; ein typisches Beispiel hierfür sind die Hausärzte (general practitioners, GPs) in Großbri- 
tannien. Unter den eingeschlossenen Fallstudien ist das typischste Beispiel für eine Datenbank, die von 
GPs erfassten Daten zusammenführt, der Clinical Practice Research Datalink (CPRD). CPRD führt 
Daten von Praxen zusammen, die sich in das Programm eingeschrieben haben (.,opt-in“). Patienten 
dieser Praxen können sich wiederum von der Datenübermittlung ausschließen lassen (,,opt-out*). Die 
von CPRD gehaltenen Daten können für Beobachtungsstudien beantragt werden, oder zur Durchfüh- 
rung von experimentellen Studien unterstützend herangezogen werden. Sie können darüber hinaus mit 
anderen Datensätzen von NHS Digital verknüpft werden, um reichere, sektorenübergreifende Einsich- 
ten zu ermöglichen. Die Datenbank zur Primärversorgung des niederländischen Forschungsinstituts 
Nivel setzt ebenso Daten aus der Primärversorgung ein, allerdings kommen hier die Daten aus den 
elektronischen Praxisverwaltungssystemen auch von Leistungserbringern jenseits der Hausärzte zu- 
sammen. 

In der Recherche wurden mehrere Fallstudien identifiziert, in denen verschiedene Datenquellen mit 
unterschiedlichem Inhalt von zentralen Stellen über eine oder mehrere Verlinkungsvariablen verknüpft 
werden. Das übergreifende Ziel der hierunter fallenden Initiativen ist es, einen besseren Datenzugang 
für die Forschung zu ermöglichen. Dabei werden Daten aus verschiedenen Quellen, insbesondere von 


verschiedenen öffentlichen Institutionen verlinkt. So können bspw. Daten zur gesundheitlichen Ver- 
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sorgung mit Daten aus dem Bildungsbereich und Kriminalitätsstatistiken verknüpft werden. Die Mög- 
lichkeit des Datenzugriffs ist bei fast allen Initiativen über Antragsverfahren geregelt. Diese Fallstu- 
dien heben die Möglichkeiten klar hervor, die sich auf Basis solcher zentralen Stellen für die Zusam- 
menführung unabhängig entstandener Datensätze für die Versorgungsforschung eröffnen. Unter- 
schiedlich unter den hier aufgeführten Fallstudien — und relevant im Hinblick auf die Überlegungen 
für eine potenzielle Ideengewinnung für den deutschen Raum - ist das Ausmaß der Konsolidierung 
der unterschiedlichen Datenbestände. So verknüpfen zum Beispiel das australische PHRN und das 
kanadische SDLE die Daten projektspezifisch, während die Quelldatensätze grundsätzlich verteilt 
bleiben. Im Gegensatz hinzu fügt die „integrierte“ neuseelándische IDI eingegangene Daten mithilfe 
eines „Spine“ zusammen. 

Eine erfolgreiche Verlinkung setzt die Möglichkeit einer eineindeutigen Zuordnung von Informationen 
aus separaten Datensätzen voraus. Dazu sind geeignete Schlüsselvariablen notwendig, die in allen zu 
verlinkenden Datensätzen vorhanden sind. Für eine personenbezogene Verlinkung ist es aus daten- 
schutzrechtlichen Gründen häufig notwendig, statt eindeutiger personenidentifizierender Merkmale 
aus den Originaldaten, wie eine Versicherungs- oder Ausweisnummer, Pseudonyme einzusetzen; da- 
bei muss für alle zu verlinkenden Datenquellen dasselbe Pseudonymisierungsverfahren angewendet 
werden. Die Verlinkungsinitiativen in den Ländern zeigen, dass auch ohne das Vorhandensein eines 
eindeutigen Identifikators eine Verknüpfung auf Basis anderer identifizierender Merkmale möglich ist 
und seit mehreren Jahren erfolgreich eingesetzt wird. Darüber hinaus sind die Verteilungen der Zu- 
ständigkeiten variabel — nichtsdestotrotz kann man beobachten, dass der Einsatz von Vertrauensstellen 
unterschiedlicher Zugehörigkeiten als üblich gilt. Die detaillierte technische Beschreibung möglicher 
De-Identifikations- und Verlinkungsoptionen geht über den Rahmen dieses Gutachtens hinaus. 
Nichtsdestotrotz werden beispielhaft vereinzelte Ansätze beleuchtet, um erste Ideen für zukünftige 
Diskussionen zu erlauben. Die Verlinkungsinitiativen in den Ländern zeigen, dass auch ohne das Vor- 
handensein eines eindeutigen Identifikators eine Verknüpfung auf Basis anderer identifizierender 
Merkmale möglich ist und seit mehreren Jahren erfolgreich eingesetzt wird. Darüber hinaus sind die 
Verteilungen der Zuständigkeiten variabel — nichtsdestotrotz kann man beobachten, dass der Einsatz 
von Vertrauensstellen unterschiedlicher Zugehörigkeiten als üblich gilt. 

Da Daten im Gesundheitssystem grundsätzlich sensibel sind, kommen in der Regel drei Zugangswege 
in Frage: (1) eine direkte Datenübermittlung, die ein angemessenes Datenschutz- und Datensiche- 
rungskonzept voraussetzt; (2) die Inhouse-Auswertung, die an geeigneten Gastarbeitsplätzen der da- 
tenhaltenden Institution stattfindet; und (3) die Fernabfrage, die auf separaten Servern mit „remote 
access“ über VPN-Verbindung möglich ist. Wie Tabelle 6.1 zu entnehmen ist, kommen alle drei Zu- 
gangswege in der Stichprobe der eingeschlossenen Fallstudien vor. Der bisher eingesetzte Ansatz für 
die Bearbeitung der DaTraV-Daten in Deutschland wurde so in keinem anderen Land identifiziert. 
Hingegen scheinen sowohl die Nutzung von Gastarbeitsplätzen als auch die Fernabfrage über VPN 


zunehmend Anwendung zu finden. 
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In den letzten Jahren haben einzelne Länder in der Stichprobe Initiativen eingeführt, die elektronische 
Patientenakten anbieten und somit potenziell auch neue Datensätze für die Forschung schaffen könn- 
ten. Dabei gibt es in Australien sowie in Österreich die Möglichkeit für Patienten, entweder ganz aus 
der Nutzung der elektronischen Akte auszusteigen oder aber bestimmte Eintragungen nicht vornehmen 
zu lassen bzw. diese nicht in der Akte freizugeben. 

Die thematisierten Fallstudien aus dem internationalen Vergleich heben wichtige Aspekte hervor, die 
für die Problematik in Deutschland von Bedeutung sein könnten. Neben dem Mehrwert von ver- 
gleichsmäßig einfach zugänglichen, umfangreiche(re)n Abrechnungsdaten, die schneller als in 
Deutschland vorliegen, sektorenübergreifende Analysen erlauben und personenbezogen mit Gesund- 
heits- sowie auch mit Regionaldaten verknüpfbar sind, wird auch das Potential von Datenbanken be- 
leuchtet, die auf Basis der routinemäßigen Dokumentation (i.d.R. elektronischen Gesundheitsakten) 
von Leistungserbringern entstehen. Eine Investition in diese Richtung, wie sie zum Beispiel in Groß- 
britannien mit CPRD erfolgte, kann nicht nur für das eigene Gesundheitssystem Einsichten ermögli- 
chen, sondern auch die internationale Kooperation fördern und zur internationalen Sichtbarkeit wis- 
senschaftlicher Exzellenz beitragen. 

Eine Nebeneinanderstellung der in Deutschland vorhandenen Datenbestände und der in anderen Län- 
dern eingesetzten Daten deutet darauf hin, dass sich die Diskussion hierzulande an erster Stelle mit der 
Ausgestaltung der zur Verfügung stehenden Daten befassen sollte und ergänzend die Erfassung zu- 
sätzlicher Informationen bedenken kann. Das letzte Kapitel des Gutachtens liefert konkrete Empfeh- 


lungen, wie dies vor dem aktuellen regulatorischen Hintergrund erreicht werden könnte. 
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Abstract 


Eine unabdingbare Voraussetzung für die Beantwortung der Forschungsfragen der Versorgungs- 
forschung sind das Vorhandensein und die Zugänglichkeit von umfassenden Daten hoher Qualität. Es 
ist davon auszugehen, dass die Versorgungsforschung in den kommenden Jahren auf der Verlinkung 
(Datenlinkage, „data linkage“), also der Verknüpfung mehrerer Datenquellen auf Basis von geeigneten 
gemeinsamen Schlüsselvariablen beruhen wird. In Deutschland werden umfassende Daten hoher Qua- 
lität routinemäßig gesammelt, allerdings sind diese für Forschungszwecke nur bedingt geeignet und 
eingeschränkt verfügbar. Daher liegt der Ursprung dieses Gutachtens in den Grundfragen, welche 
Frage-stellungen der Versorgungsforschung im Ausland auf Basis besserer Daten besser beantwortet 
werden können, und auf welchen Wegen eine solche Verbesserung der Datengrundlage in Deutschland 
erzielt werden könnte. 

Fallbeispiele interessanter Verlinkungsansätze aus zwölf Ländern wurden identifiziert und anhand 
eines vordefinierten Konzeptes analysiert. Informationen wurden für alle Vergleichsländer bzw. Fall- 
studien zunächst auf Basis von Öffentlich zugänglichen Quellen identifiziert. Anschließend wurde pro 
Land ein Profil erstellt und geeigneten Länderexperten zur Validierung und Ergänzung weitergeleitet. 
Das Gutachten stellt eine Übersicht der eingeschlossenen Fallstudien vor (Kapitel 3), sowie im An- 
hang wichtige Eckdaten pro Land und Fallstudie. Es folgen eine nähere Betrachtung der Möglichkei- 
ten der Nutzung von Routinedaten (Kapitel 4), der Verlinkungsmöglichkeiten mit und ohne eindeuti- 
ges personenbezogenes Merkmal (Kapitel 5), der unterschiedlichen Zugriffswege für Forscher (Kapi- 
tel 6), der Ausgestaltung des Einsatzes von Daten aus elektronischen Patienten- bzw. Gesundheitsak- 
ten für die Forschung (Kapitel 7) und ein Zwischenfazit (Kapitel 8). Das Gutachten endet mit einer 
Wunschliste für mögliche regulatorische Änderungen in Anbetracht der aktuellen politischen Diskus- 
sion (Kapitel 9). 

Wichtig ist hier zu beleuchten, dass die thematisierten Fallstudien aus dem internationalen Vergleich 
wichtige Aspekte hervorheben, die für die Problematik in Deutschland von Bedeutung sein könnten. 
Neben dem Mehrwert von vergleichsmäßig einfach zugänglichen, umfangreiche(re)n Abrechnungs- 
daten, die schneller als in Deutschland vorliegen, sektorenübergreifende Analysen erlauben und perso- 
nenbezogen mit Gesundheits- sowie auch mit Regionaldaten verknüpfbar sind, wird auch das Potential 
von Datenbanken beleuchtet, die auf Basis der routinemäßigen Dokumentation (i.d.R. elektronischen 
Gesundheitsakten) von Leistungserbringern entstehen. Eine Investition in diese Richtung kann nicht 
nur für das eigene Gesundheitssystem Einsichten ermöglichen, sondern auch die internationale Koope- 
ration fördern und zur internationalen Sichtbarkeit wissenschaftlicher Exzellenz beitragen. 

Eine Nebeneinanderstellung der in Deutschland vorhandenen Datenbestände und der in anderen Län- 
dern eingesetzten Daten deutet darauf hin, dass sich die Diskussion hierzulande an erster Stelle mit der 
Ausgestaltung der zur Verfügung stehenden Daten befassen sollte und ergänzend die Erfassung zu- 


sätzlicher Informationen bedenken kann. 
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Kapitel 1: Hintergrund und Problemstellung 


Die Versorgungsforschung („health services research“) hat sich in Deutschland und international be- 
reits als vielfältige Disziplin mit komplexem, transdisziplinärem Charakter etabliert (Pfaff et al. 2017, 
Raspe et al. 2010). Im internationalen Vergleich war Deutschland nicht unter den Vorreitern, denn erst 
Ende der neunziger Jahre hat sich hierzulande ein eigenständiges Forschungsgebiet entwickelt, das mit 
dem inzwischen allgemein anerkannten Begriff „Versorgungsforschung“ einen multidimensionalen, 
methodisch, theoretisch und inhaltlich differenzierten Aufgabenbereich umfasst (Raspe et al. 2010). 
Seitdem spiegelt sich die Anerkennung der Wichtigkeit dieses Forschungsgebietes für die Unterstüt- 
zung und Optimierung des deutschen Gesundheitssystems auf politischer, gesetzlicher und finanzieller 
Ebene wider (Schrappe & Pfaff 2017). Frühen Förderinitiativen, zum Beispiel durch die Bundesärzte- 
kammer (2005-2010), folgte ein Vorhaben zum Ausbau der Disziplin in den Koalitionsverträgen 2009 
und 2013, und aktive Investitionen durch die Bundesregierung (z.B. Aktionsplan Versorgungsfor- 
schung des BMBF, Ressort Versorgungsforschung des BMG), und die Deutsche Forschungsgemein- 
schaft (DFG). Nicht zuletzt durch die gesetzliche Verankerung des Innovationsfonds im GKV- 
Versorgungsstärkungsgesetz im Jahr 2015 wurde die Weiterführung dieser Intention verdeutlicht. 

Die DFG stellt drei grundlegende Merkmale der Versorgungsforschung dar, die das Verständnis dieser 
Disziplin prägen: das besondere Problemfeld der gesundheitlichen Versorgung der Bevölkerung, eine 
Fokussierung auf die Organisation, Regulierung und Verbesserung dieser Versorgung, und eine kon- 
krete primäre Zielsetzung, die auf eine evidenzbasierte Beratung von Personen bzw. Einrichtungen mit 
Steuerungsfunktionen im Gesundheitswesen abzielt. Schrappe und Pfaff definieren die Versorgungs- 
forschung als „ein fachübergreifendes Forschungsgebiet, das ausgehend von der Patienten- sowie Po- 
pulationsperspektive und vor dem Hintergrund komplexer Kontextbedingungen die Versorgungsstruk- 
turen und -prozesse der Gesundheitsversorgung untersucht, den Outcome auf Ebene der Alltagsver- 
sorgung beschreibt und komplexe Interventionen zur Verbesserung der Versorgung evaluiert“ 
(Schrappe & Pfaff 2017). Beide Betrachtungen heben ein grundlegendes Alleinstellungsmerkmal der 
Disziplin hervor, die erste implizit und die zweite explizit: im Fokus stehen komplexe Interventionen, 
die unter komplexen Kontextbedingungen eingesetzt werden und entsprechend evaluiert werden müs- 
sen (sog. „doppelte Komplexität“, vgl. Abbildung 1.1). Die Abgrenzung der Versorgungsforschung 
von anderen Stufen der biomedizinischen Forschung wird in Tabelle 1.1 thematisiert. 

Die Fragestellungen der Versorgungsforschung umfassen neben der deskriptiven und Inferenz- 
orientierten Analyse entlang der drei Versorgungsqualitätsdimensionen von Avedis Donabedian 
(Strukturen, Prozesse und Outcomes) (Donabedian, 1980) auch die Versorgungskonzeption und das 
Versorgungsmanagement, und somit auch die Implementierung und die Evaluation von Interventionen 
(Schrappe & Pfaff 2017). Unabdingbare Voraussetzungen für die aussagekräftige Beantwortung aller 
dieser Fragen, vor allem vor dem Hintergrund der doppelten Komplexität, sind das Vorhandensein und 


die Zugänglichkeit von umfassenden Daten hoher Qualität. 
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Quelle: in Anlehnung an Schrappe & Pfaff 2017 


Abbildung 1.1 Forschungsstadien und Evidenzgenerierung 


Tabelle 1.1 Abgrenzung der Disziplinen innerhalb der (bio)medizinischen Forschung 


Biomedizinische Klärung (patho-) physiologischer Mechanismen, Entde- 

Grundlagenforschung ckung/Erfindung einer neuen Gesundheitstechnologie 

Translationsforschung Erste Anwendung an Gesunden bzw. Kranken (‚from bench to bed- 
side“, „proof of principle“; entspricht Phase I- & II-Studien in der 
Arzneimittelforschung) 

Klinische Forschung Evidenz für Wirksamkeit und Nutzen unter (artifiziellen) Studienbe- 

Transferforschung dingungen (,,from bedside to market“; entspricht Phase IM-Studien 


(clincal evaluative sciences) |in der Arzneimittelforschung) 


Evidenz für Nutzen unter Alltagsbedingungen 
(„from early market to routine care“; entspricht pragmatischen 
RCTs, Phase-IV-Studien, Anwendungsbeobachtungen, Outcomes 


Research) 
Versorgungsforschung Beobachtung, Analyse, Prognose, Bewertung, Weiterentwicklung 
(health services research) und Evaluation der Routineversorgung 


Quelle: Raspe et al. 2010 

Je nach Fragestellung unterscheiden sich die angemessenen Datenquellen und die zu untersuchenden 
Endpunkte. Obwohl gezielt durchgeführte Primärstudien hier eine wichtige Rolle spielen, ist die Ver- 
sorgungsforschung als Disziplin dadurch charakterisiert, dass häufig auf Sekundärdaten zurückgegrif- 
fen wird, also auf Daten, die ursprünglich für einen anderen Zweck generiert wurden (vgl. Abbildung 
1.1). Hierzu gehören unter anderem Daten aus klinischen und epidemiologischen Registern und Routi- 
nedaten, die während des Versorgungsgeschehens entstehen, wie zum Beispiel die Abrechnungsdaten 
der gesetzlichen Krankenversicherung. In den letzten Jahren ist das umstritten definierte Konzept von 
„Big Data“ zu den Evidenzgrundlagen der Versorgungsforschung hinzugekommen. Trotz des Mangels 


an einer allgemeingültigen Definition gibt es gewisse Elemente, die Big Data eindeutig charakterisie- 
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ren: es handelt sich um Datenmengen, die so groß und komplex sind, dass sie mit den üblichen Daten- 
verarbeitungsmethoden nicht adäquat gemanagt oder ausgewertet werden können (vgl. McKinsey 
2011). Im gängigen Gebrauch des Begriffs sind „Big Data“ zum Teil unstrukturierte Datenmengen, die 
vorwiegend auf Basis von neuen, digitalen Anwendungen mit großer Geschwindigkeit generiert und 
ausgewertet werden können. So haben sie theoretisch das Potential, komplexe Versorgungsverläufe 
abzubilden und zu relevanten Erkenntnissen im Rahmen der Versorgungsforschung beizutragen (vgl. 
Wegscheider & Koch-Gromus 2017). 

Vor dem Hintergrund der dynamischen Landschaft der unterschiedlichen Datengrundlagen, die für die 
Versorgungsforschung von Nutzen sein könnten, und der zunehmenden Wichtigkeit von Fragestellun- 
gen, für deren Beantwortung ein breites Spektrum an Informationen erforderlich ist (z.B. zum Einfluss 
des Klimawandels auf gesundheitsbezogenen Outcomes), ist davon auszugehen, dass die Versorgungs- 
forschung in den kommenden Jahren auf der Verlinkung (Datenlinkage, „data linkage“), also der Ver- 
knüpfung mehrerer Datenquellen auf Basis von geeigneten gemeinsamen Schlüsselvariablen beruhen 
wird. Die Datenquellen beinhalten Routinedaten, verbunden mit — oder verknüpfbar mit — klinischen 
Daten und weiteren, teils unstrukturierten Alltags- und Kontextdaten. Der Anspruch an Daten auf hohe 
Validität, Vollständigkeit, Aktualität, Repräsentativität und Qualität soll davon unberührt bleiben — 
aber es ist zu erwarten, dass die Forschung zunehmend in größeren Verbünden stattfindet. 

In Deutschland werden umfassende Daten hoher Qualität routinemäßig gesammelt (siehe Tabelle 1.2; 
Nimptsch et al. 2015; DIMDI 2014, Nimptsch & Mansky 2010). Allerdings sind diese für Forschungs- 
zwecke nur bedingt geeignet und eingeschränkt verfügbar (Schreyögg 2016, Kreis et al. 2016). Die 
Datenbestände einzelner gesetzlicher Krankenkassen bieten zwar die Möglichkeit, den Versorgungs- 
prozess sektorenübergreifend abzubilden, können aber keinen Anspruch auf Repräsentativität für die 
Bevölkerung erheben und beinhalten keine Leistungen, die nicht über die Kasse abgerechnet wurden 
(Geyer & Jaunzeme 2015); für jedes Forschungsvorhaben ist eine gesonderte Kooperationsbasis mit 
den entsprechenden Sozialversicherungsträgern erforderlich. Der mit dem GKV-Modernisierungs- 
gesetzt ($303a-e SGB V) eingeführte gemeinsame Datenpool der Krankenkassen wurde erst 2012 mit 
der Datentransparenzverordnung (DaTraV) umgesetzt und ermöglicht seitdem einen kassenübergrei- 
fenden Zugang zu versichertenbezogenen Diagnose-, Arzneimittel-, und Ausgabendaten. Jedoch ba- 
siert dieser Datensatz auf den für den morbiditätsorientierten Risikostrukturausgleich benutzten Infor- 
mationen, die die Kassen dem Bundesversicherungsamt (BVA) übermitteln. Das Deutsche Institut für 
Medizinische Dokumentation und Information (DIMDI) erhält diese Daten mit einem Zeitverzug von 
ca. vier Jahren und stellt sie dann für Forschungszwecke bestimmten Nutzungsberechtigten zur Verfü- 
gung. Bei den Daten fehlen wichtige Variablen, die die Anwendbarkeit für viele Fragestellungen er- 
heblich einschränken, wie zum Beispiel Kodes zu Prozeduren oder Kennzeichen für die ambulanten 
und stationären Leistungserbringer (vgl. Schreyögg 2016, Hoffmann & Glaeske 2017). Der Zugang ist 
aktuell nur über Datenfernverarbeitung für a priori definierte Fragestellungen und Methoden möglich, 


welches in der Regel zu längeren Verzögerungen bei der Bearbeitung führt und komplexe Auswertun- 
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gen erheblich erschwert. Sektorenspezifische Abrechnungsdaten, wie die DRG-Statistik nach $ 21 
KHEntgG oder die Daten der kassenärztlichen Vereinigungen eignen sich vorwiegend für Fragestel- 
lungen, die sich (ausschließlich) auf Leistungen des entsprechenden Sektors beziehen. Aus der (nicht 
abschließenden) Darstellung in Tabelle 1.2 wird deutlich, dass in Deutschland viele Datenbestände 
nebeneinander bestehen, die jedoch stark fragmentiert sind. 
Mit dem kurz vor Fertigstellung dieses Gutachtens beschlossenen Digitale-Versorgung-Gesetz (DVG) 
soll die Nutzbarkeit der GKV-Routinedaten für Forschungszwecke auf der Grundlage der $$ 303a-e 
SGB V verbessert werden. Vorgesehen ist, die Datenaufbereitungsstelle zu einem Forschungsdaten- 
zentrum weiterzuentwickeln und die Zugangsmöglichkeiten zu verbessern. Auch das Datenangebot 
soll erweitert werden, indem die Krankenkassen definierte Kosten- und Leistungsdaten aus der ambu- 
lant-ärztlichen Versorgung, Arzneimittelversorgung, Krankenhausversorgung, der Versorgung durch 
Hebammen und der Heil- und Hilfsmittelversorgung an den GKV-Spitzenverband, der dann als Daten- 
sammelstelle fungieren soll, übermitteln. Das Nähere zu Art und Umfang dieser Daten soll per 
Rechtsverordnung festgelegt werden, die das Bundesministerium für Gesundheit im Benehmen mit 
dem Bundesministerium für Bildung und Forschung ohne Zustimmung des Bundesrates bestimmt. 
Im internationalen Vergleich ist erkenntlich, dass die Entwicklung der Versorgungsforschung als ei- 
genständiger Disziplin in mehreren anderen Ländern früher stattfand (Raspe et al. 2010, Schrappe & 
Pfaff 2017, HSR-Europe 2011). Auch vor dem Hintergrund unterschiedlicher Datenschutzbestimmun- 
gen hat dies dazu geführt, dass im Ausland zum Teil vielfältigere Erkenntnisse aufgrund besserer Da- 
tenzugänglichkeit erzielt werden können (vgl. OECD 2015). Daher liegt der Ursprung dieses Gutach- 
tens in den Grundfragen, 

a) welche Fragestellungen der Versorgungsforschung im Ausland auf Basis besserer Daten be- 

antwortet werden können, und 
b) auf welchen Wegen eine solche Verbesserung der Datengrundlage in Deutschland erzielt wer- 
den könnte. 

Der Fokus wird dabei auf die Verlinkung von unterschiedlichen Datengrundlagen zur Beantwortung 
komplexer Fragestellungen gelegt, um den oben beschriebenen aktuellen Herausforderungen nachzu- 
gehen. Näheres zur Methodik des Gutachtens wird im nächsten Kapitel beschrieben. Letztlich war es 
ein Ziel des Gutachtens, vorhandene Arbeit aus dem deutschen und internationalen Raum, die deskrip- 
tiv internationale Evidenzgrundlagen für die Versorgungsforschung zusammenfasst, nicht zu replizie- 


ren, sondern zu erweitern und zu vertiefen (vgl. OECD 2015, OHE 2015, Gothe 2015). 


Tabelle 1.2 Wichtigste Sekundärdatensätze für die Versorgungsforschung in Deutschland, Stand 
November 2019 
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? Hausarztzentrierte Versorgung, besondere ambulante ärztliche Versorgung, integrierte Versorgung. 

SGB: Sozialgesetzbuch, BVA: Bundesversicherungsamt, KV: Kassenärztliche Vereinigung, DAV: Datenan- 
nahme- und Verteilstelle, DaTraV: Datentransparenzverordnung, MVZ: Medizinische Versorgungszentren, 
FDZ: Forschungsdatenzentrum, KHEntgG: Krankenhausentgeltgesetz, InEK: Institut für das Entgeltsystem im 
Krankenhaus BKRG: Bundeskrebsregistergesetz, ZfKD: Zentrum für Krebsregisterdaten, RKI: Robert-Koch- 
Institut, QS: Qualitätssicherung, IQTIG: Institut für Qualitätssicherung und Transparenz im Gesundheitswesen, 
BevStatG: Bevölkerungsstatistikgesetz, BBR: Bundesamt für Bauwesen und Raumordnung, INKAR: Indikato- 
ren und Karten zur Raum- und Stadtentwicklung 


Kapitel 2: Methodik des Gutachtens 


Zur Beantwortung der Grundfragestellungen sollte im Detail untersucht werden, mit welchen Metho- 
den und unter welchen Voraussetzungen in ausgewählten Ländern erfolgreich (gute) Datengrundlagen 
geschaffen worden sind. Der Aufbau — und damit verbunden die Verlinkungsmöglichkeit — von rele- 
vanten Datengrundlagen stehen in engem Zusammenhang mit der organisatorischen Gestaltung des 
Gesundheitssystems, vor allem der Struktur der Leistungserbringung und der entsprechenden Abrech- 
nungs- und Vergütungsmechanismen. Ihre Zugänglichkeit wird darüber hinaus von Datenschutzbe- 
stimmungen und -normen, zum Teil auch kultureller Art, geprägt. Daher wurde die Analyse in diesem 
Gutachten so konzipiert, dass Erkenntnisse zu Datenstruktur und -Fluss so weit wie möglich system- 
unabhängig bzw. -übertragbar sind, während möglichst auch länderspezifische regulatorische Rah- 
menbedingungen erfasst und analysiert werden können. 

Analytisches Konzept: Für die Analyse der identifizierten Fallstudien aus dem internationalen Ver- 
gleich wurde ein Konzept entwickelt, welches zwischen Datenbeständen mit versorgungsrelevanten 
Daten i) auf Individualebene (‚individual level data“, also Mikrodaten) und Daten auf Nicht- 
Individualebene (,,non-individual level data“) und ii) aus drei bzw. vier großen inhaltlichen Blöcken 
(Gesundheitsdaten, Gesundheitsversorgungsdaten, soziodemographischen- bzw. ökonomischen Daten, 
Umweltdaten) unterscheidet (Abbildung 2.1). 

In Abbildung 2.1 sollen die Pfeile die (möglichen) Verknüpfungsmöglichkeiten symbolisieren, die für 
die Individualdaten entweder über die Speicherung in gemeinsamen Datenbanken (z.B. beruhend auf 
einer elektronischen Gesundheitsakte) oder über eine Verlinkungsmöglichkeit via eines eindeutigen 
personenbezogenen Merkmals (,,[unique] patient identifier“) stattfinden. Genauso relevant sind aber 
auch die Verknüpfungsmöglichkeiten der Individualdaten mit den nicht-individuellen Daten und von 
diesen untereinander. Es ist nicht zu erwarten, dass Daten(banken) notwendigerweise wie in Abbil- 
dung 1 strukturiert sind; die Kategorien sollen vielmehr dazu dienen, die jeweils enthaltenen Daten 
inhaltlich zu klassifizieren. 

Beispiele für Variablen aus den unterschiedlichen Datenkategorien in Abbildung 2.1 werden in Abbil- 
dung 2.2 aufgeführt (vgl. auch Datenschutz-Grundverordnung (DSGVO), Erwägungsgründe 35 und 
53). 
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Abbildung 2.1 Analysekonzept 
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Abbildung 2.2 Mögliche Inhalte unterschiedlicher Datenkategorien 
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Auswahl der Vergleichsländer und der Fallstudien: Um die Stichprobe der Vergleichsländer für 
das Gutachten auszuwählen, wurden drei Hauptkriterien zugrunde gelegt: 

a) eine Mischung aus Gesundheitssystemstrukturen, d. h. sowohl solche, die aus Sozialversiche- 
rungssystemen mit mehreren Versicherungsträgern stammen und somit im Aufbau der Daten- 
struktur in Deutschland ähneln müssten, als auch welche, die ggf. Impulse für eine völlig neue 
Denkweise anbieten; des Weiteren sollten Systeme mit unterschiedlichen Ausprägungen der 
Dezentralisierung von Leistungserbringung und Gesundheitssystemsteuerung vertreten sein; 

b) ein Spektrum bezüglich der Datenverfügbarkeit und -nutzung — hierzu wurde die periodische 
Befragung zur Health Data Governance der OECD herangezogen (OECD 2015), die die Akti- 
vität mehrerer OECD-Länder hinsichtlich der Regulierung, des Aufbaus und der Nutzung von 
gesundheitsbezogenen Datengrundlagen beschreibt; und 

c) bekannte interessante Beispiele relevanter Initiativen waren ebenfalls abzudecken. Diese wur- 
den auf Basis von Diskussionen der Arbeitsgruppe sowie mit dem Wissenschaftlichen Beirat 
des Zentralinstituts für die Kassenärztliche Versorgung ausgewählt. 

Somit erhebt das Gutachten keinen Anspruch auf eine Vollständigkeit oder eine strenge Systematik 
hinsichtlich der eingeschlossenen Länder. Ebenso wenig wurde eine erschöpfende Darstellung der 
Datenbestände der eingeschlossenen Länder angestrebt. Vielmehr ging es darum, wichtige und poten- 
tiell nützliche Fallstudien zu identifizieren, die Erkenntnisse zu mehr oder weniger ,,disruptiven“ Lö- 
sungsansätzen für die deutsche Realität liefern. 

Nichtsdestotrotz wurden vor dem Hintergrund der in Kapitel 1 geschilderten Limitationen der deut- 
schen Datenbestände, der gesetzgeberischen Dynamik hinsichtlich der Implementierung der elektroni- 
schen Patientenakte während der Bearbeitungsperiode (2019) und der Tatsache, dass klinische Daten 
in Deutschland zumindest aktuell fast ausschließlich aus Registern bzw. Befragungen kommen, Fall- 
studien priorisiert, die eine Zusammenführung von intersektoralen Routinedaten, Daten aus elektroni- 
schen Patienten- bzw. Gesundheitsakten sowie Registern ermöglichen. Zusätzliche Fallstudien wurden 
im Laufe der Recherche aus der Literatur und nach Empfehlungen der Länderexperten (siehe unten) 
eingeschlossen. 

Tabelle 2.1 zeigt die endgültige Auswahl an Ländern, die im Rahmen dieses Gutachtens herangezogen 
wurden, den primären Interessensgrund pro Land sowie das Scoring hinsichtlich Datenverfügbarkeit, - 


reife und -nutzung gemäß OECD (OECD 2015). 
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Tabelle 2.1 Länderauswahl und jeweilige Einschlussbegründung 


Australien 


Niederlande 


Österreich 


U 
England 


K 
K 


U 
Schottland 


Interessensgrund 


Dezentral verteilte Datenquellen werden unter 
Beteiligung der Datenhalter über eine zentrale 
Vertrauensstelle studienspezifisch zu „Meta- 
data“ zusammengeführt. 


Alle Routinedaten und zunehmend auch klini- 
sche Daten werden zusammengeführt; akade- 
mische Einrichtungen erhalten vergleichsweise 
einfach Zugang. 


Neue digitale Vernetzungsmöglichkeiten er- 
leichtern die Zusammenführung und Bereit- 
stellung von Gesundheitsdaten. 


Regionale Verlinkungsinitiativen brin- 
gen auf Basisunterschiedlicher strukturellen Mo 
delle mehrere Datenbestände zusammen. 


Integrated Data Infrastructure, die alle öffentli- 
chen Daten (bis hin zum Zensus) zusammen- 
fasst und auf Antrag für Projekte, die in öffent- 
lichem Interesse sind, nutzen lässt. 


Daten mehrerer Leistungsanbieter im ambu- 
lanten Sektor werden zusammengeführt, um in- 
tegrierte Versorgung zu ermöglichen und kön- 
nen für Forschungszwecke benutzt werden. 


Neu eingeführte elektronische Patientenakte mit 
vorgesehener Forschungszugänglichkeit; meh- 
rere Krankenversicherer, regionale und zentrale 
Gesundheitsberichtserstattungssysteme. 


Gut etablierte, verlinkbare Patientenregister; 
Nutzung verlinkter Daten zur Unterstützung kli- 
nischer Leitlinien. 


Eine zentrale Krankenkasse macht die Routi- 
nedaten aller >50 Millionen Südkoreaner auf 
einem zentralen Server antragsweise für For- 
schung zugänglich. 

Clinical Practice Research Datalink sammelt 
deidentifizierte Daten von mehr _ als 
10 Millionen Patienten. (Quelle: Hausärzte). 


Daten aller Einwohner aus verschiedensten 
Quellen (Apotheken, Hausärzte, Kranken- 
häuser, öffentliche Behörden wie Polizei) wer- 
den auf regionaler und nationaler Ebene aufbe- 
wahrt und können über den Community Health 
Index verlinkt werden. 


Forschungseinrichtungen treffen auf privatrecht- 
licher Basis Vereinbarungen mit Organisationen 
und Einzelpersonen, bieten Erkenntnis gegen 
Datenspende. 


Ranking OECD (2015)* 
Daten- Daten- |Rang** 
verfügbarkeit nutzung 


nicht erfasst 


Mittel 
Mittel 


nicht erfasst 


Mittel 
Mittel 


© 


A 


— j — 
N 


loo) 


ji 


*niedrig / mittel / hoch = 0-33 % / 34-66 % / 67-100 % aller Datenbestände, die zur Verfügung stehen bzw. 
regelmäßig zu Forschungszwecken verknüpft werden; ** unter den 22 erfassten Ländern in Anbetracht einer 
Reihe von Variablen bezüglich Datenverfügbarkeit, -reife, und -nutzung (Platz 1 entspricht dem höchsten und 
somit besten Score; dieser wurde 2015 von Island belegt) 


13 


Entwicklung des Erhebungsinstruments. Zur Beschreibung der eingeschlossenen Fallstudien und 
der relevanten Rahmenbedingungen in den Vergleichsländern wurde ein Erhebungsinstrument in meh- 
reren Schritten entworfen, abgestimmt, pilotiert, angepasst und schlussendlich angewendet. Im No- 
vember 2018 wurde eine erste Version entwickelt und mit dem Wissenschaftlichen Beirat des Zentra- 
linstituts für die Kassenärztliche Versorgung abgestimmt. Anschließend wurden sechs Länder aus der 
Stichprobe ausgewählt (Australien, England, Neuseeland, Schottland, Schweden, Südkorea), um den 
Einsatz des Erhebungsinstruments grundsätzlich zu pilotieren, dessen Sinnhaftigkeit und Angemes- 
senheit für die Beantwortung der Fragestellungen zu überprüfen und ggf. Inhalte und/oder Form zu 
optimieren. Die Auswahl der Pilotländer reflektierte sowohl das Ergebnis von Machbarkeitsanalysen 
zum Umfang öffentlich zugänglicher Informationen sowie eine Mischung der ursprünglichen Interes- 
sensgründe, die die Länderstichprobe für das Projekt bedingt haben (Tabelle 2.1). Tatsächlich erwies 
es sich als notwendig, den Aufbau des Erhebungsinstruments anzupassen, da es ursprünglich von der 
Datenstruktur im deutschen Gesundheitssystem geprägt und somit für andere Länder nicht eindeutig 
zu übertragen war. Nach einer weiteren Beratung mit dem Wissenschaftlichen Beirat entstand die end- 
gültige Version des Erhebungsinstrumentes; diese findet sich (aus dem Englischen übersetzt) in Tabel- 


le 2.2 wider. 


Tabelle 2.2 Erhebungsinstrument zur Beschreibung von Fallstudien 


Allgemeine Fragen pro Land Spezifische Fragen pro Fallstudie 


e Aufbau des Gesundheitssystems, Or- 
ganisation der Leistungserbringung 

e Gesetzlicher Rahmen für Datennut- 
zung und -sicherheit (allgemein und 
spezifisch zu Gesundheit) 

e Strategien für Gesundheitsdaten: Im- 
plementierung und zuständige Akteure 
e Auswahl von interessanten Initiativen 
für Deutschland 

e Ggf. Zusätzliche Dateninnovationen 
der letzten Jahre 


e Publikationen, die als Fallbeispiele 
für die Datennutzung dienen können 
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e Primäres Ziel: Forschung, Governance/Qualitätssicherung, 
Versorgungskoordination, Vergütung usw. 

e Welche Daten werden erhoben und wer erhebt sie? Sind erho- 
bene Daten strukturiert/ unstrukturiert? 

e Auf welcher Ebene werden Daten aggregiert (regio- 
nal/national/?) und wer ist dafür zuständig? 

e Werden Plausibilitätsprüfungen durchgeführt? Durch 

wen? Wie ist die Datenqualität? 

e Wo sind Daten lokalisiert/abgespeichert und für wie lang? 
Wem gehören die Daten? (,,ownership“) 

e Können die Daten über ein UPI verlinkt werden oder werden 
andere Methoden eingesetzt? Wer ist für die Verlinkung zustän- 
dig? 

e Datenzugang: Wer ist berechtigt? Wie sieht der Prozess aus? 
Wie lange dauert es, bis Daten zur Verfügung gestellt werden 
können? Welches ist aktuell das letzte verfügbare Datenjahr? 

e Bisherige Nutzung der Daten für Forschungszwecke? 

e Wie repräsentativ ist die durch die Daten abgedeckte Bevölke- 
rung für das Land/die Region? 

e Für nicht-individuelle Daten: welche ist die kleinste Einheit, 
für die eine Verlinkung möglich ist? Wie viele dieser Einheiten 
gibt es? 


Informationssammlung und -validierung: Das weitere Vorgehen wurde in Anlehnung an die etab- 
lierte Praxis von internationalen Vergleichen am Fachgebiet Management im Gesundheitswesen der 
Technischen Universität Berlin geplant. Informationen zu den in Tabelle 2.2 aufgeführten Fragen 
wurden für alle Vergleichsländer bzw. Fallstudien zunächst auf Basis von öffentlich zugänglichen 
Quellen identifiziert, vorwiegend basierend auf Online-Recherchen nach publizierter und grauer Lite- 
ratur, sowie nach offiziellen Informationen aus der Internetpräsenz der jeweils beteiligten Akteure des 
Gesundheitssystems. Für die allgemeinen Informationen wurden zunächst die Gesundheitssystempro- 
file des Commonwealth Fund sowie die Reihe „Health Systems in Transition“ des European Obser- 
vatory on Health Systems and Policies herangezogen, ergänzt zumeist durch offizielle Dokumente 
über Datenregulierungen und -strategien der einzelnen Länder. Informationen zu den spezifischen 
Fragen pro Fallstudie wurden als erstes über die jeweilige Internetpräsenz aufgesucht, ergänzt von 
aktuellen publizierten Beschreibungen der entsprechenden Datengrundlagen sowie von Informationen 
aus publizierten Versorgungsforschungsstudien, die auf Basis der zu untersuchenden Datenbestände 
durchgeführt wurden. Anschließend wurde pro Land ein Profil erstellt und geeigneten Länderexperten 
zur Validierung und Ergänzung weitergeleitet. Passende Sachverständige wurden aus den Netzwerken 
des Fachgebiets Management im Gesundheitswesen und des Wissenschaftlichen Beirates des Zentra- 
linstituts für die Kassenärztliche Versorgung identifiziert. 

Die folgenden Kapitel stellen die Erkenntnisse in deskriptiver Synthese dar. Nach einer Übersicht der 
eingeschlossenen Fallstudien und deren Inhalt (Kapitel 3) erfolgt eine nähere Betrachtung der Mög- 
lichkeiten der Nutzung von Routinedaten (Kapitel 4), der Verlinkungsmöglichkeiten mit und ohne 
eindeutiges personenbezogenes Merkmal (Kapitel 5), der unterschiedlichen Zugriffswege für Forscher 
(Kapitel 6), der Ausgestaltung des Einsatzes von Daten aus elektronischen Patienten- bzw. Gesund- 
heitsakten für die Forschung (Kapitel 7), und ein Zwischenfazit (Kapitel 8). Das Gutachten endet mit 
einer Wunschliste für mögliche regulatorische Änderungen in Anbetracht der aktuellen politischen 
Diskussion (Kapitel 9). 

Der Anhang enthält pro Land wichtige Eckdaten (u.a. Bevölkerung und administrativer Aufbau des 
Landes, Ausgaben für Gesundheit, Aufbau der Leistungserbringung, Datenschutzbestimmungen, Grad 
der Technologischen Entwicklung) sowie die wichtigsten Informationen zu den einzelnen Fallstudien 
in Steckbrief-Format. Detailliertere Informationen sind auf Anfrage vom Fachgebiet Management im 


Gesundheitswesen erhältlich. 
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Kapitel 3: Übersicht der eingeschlossenen Länder und Fallstudien 


Dieser Kapitel liefert eine Übersicht der eingeschlossenen Fallstudien über die Vergleichsländer hin- 
weg; der Fokus lieg hierbei auf der Zielsetzung der jeweiligen Initiativen, auf ihren allgemeinen Auf- 
bau sowie auf den Umfang und die Art der Daten(bestände), die sie zusammenbringen. Tabelle 3.1 am 
Ende des Kapitels fasst diese Informationen zusammen und weist auf weitere Stellen im Gutachten, 
die die jeweilige Fallstudie näher betrachten. Eine Darstellung jeder Fallstudie in Steckbrief-Format ist 


dem Anhang zu entnehmen. 


Australien 
Australien hat eine föderale Verwaltungsstruktur mit sechs Bundesstaaten, drei Territorien und sieben 


Außenterritorien. Das Gesundheitssystem ist steuerfinanziert mit universellem Zugang zu Gesund- 
heitsleistungen, die über das Medicare Benefit Schedule (MBS) und das Pharmaceutical Benefit 
Schedule (PBS) abgerechnet werden. Medicare versteht sich als ein „öffentliches Gesundheitsversi- 
cherungssystem“ (Glover 2019). Private Zusatzversicherung ermöglicht unter anderem eine größere 
Auswahl an Leistungserbringern, schnelleren Zugang oder niedrigere Zuzahlungen; fast die Hälfte 
aller Australier macht davon Gebrauch. Die Finanzierung von Medicare wird von der Bundesregierung 
gesichert, die Organisation und Erbringung der Gesundheitsversorgung ist jedoch dezentralisiert. 
Hausärzte haben Steuerungsfunktion (,,gatekeeping“), aber Patienten müssen sich nicht mit spezifi- 
schen Hausärzten registrieren (vgl. Anhang, S. 81). Leistungserbringer in der Primärversorgung wer- 
den hauptsächlich auf Einzelleistungsbasis vergütet (,,Fee-for-service“); öffentlich finanzierte Kran- 
kenhäuser über globale Budgets und Fallpauschalen, private auf Einzelleistungsbasis. 

e Der MBS pflegt ein aktuelles und historisches Datenrepositorium aller MBS-subventionierten, 
abgerechneten Leistungen (ambulant und stationär); ähnlich hält das PBS die Daten über alle 
durch das PBS finanzierten, abgerechneten Verordnungen sowie über Verordnungen, die 
günstiger als die Zuzahlungsgrenze sind und somit der Eigenverantwortung der Bürger oblie- 
gen. Die MBS- und PBS-Daten sind versichertenbezogen verfügbar, über die „Medicare 
Number“ verknüpft, und werden regelmäßig für die Steuerung des Versicherungsprogramms 
analysiert, zum Beispiel hinsichtlich Inanspruchnahme und Kosten, zur Budgetplanung sowie 
für die Entwicklung von ,,risk-sharing agreements“ mit Arzneimittelherstellern. 

e Die MBS- und PBS-Daten sind auch für die Versorgungsforschung zugänglich und mit ande- 
ren Datenbeständen verknüpfbar, über das Angebot der regionalen Verlinkungsstellen und des 
Population Health Research Network (PHRN), welches das nationale Netzwerk dieser Stel- 
len bildet. Darüber hinaus ist das PHRN ein gesichertes Datenlaboratorium („secure data labo- 
ratory“) und ein Koordinationszentrum für elektronische Leistungen zur Datenverarbeitung. 
Es wurde im Jahr 2009 im Rahmen einer Initiative der Bundesregierung zur kollaborativen 
Forschungsinfrastruktur gegründet. Während die regionalen Datenbestände teilweise variieren, 


ist in den verlinkten Datensammlungen des PHRN ein breites Spektrum von Daten abgebildet: 
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gesundheitsbezogene Daten, einschließlich der MBS/PBS-Abrechnungsdaten, Geburten, To- 
desfälle, Neugeborenen- und Krebsregister sowie begrenzte klinische Daten und weitere Re- 
gisterdaten; dazu kommen Daten zu Wohnverhältnissen, Justiz und Bildung. Diese Investition 
der australischen Regierung in der Verlinkungsinfrastruktur habe zu einem Zuwachs der Nut- 
zung verlinkter Daten für Forschungszwecke geführt (Young & Flack 2018). 

e Fine neuere Initiative in Australien stellt die Umsetzung der elektronischen Patientenakte „my 
Health Record“ (MyHR) dar, die erst 2016 pilotiert wurde. Australische Bürger hatten bis 
Ende Januar 2019 die Möglichkeit auszuscheiden, wenn sie nicht teilnehmen wollten („opt 
out“), und 10 % der Bevölkerung haben von der „opt-out“-Option Gebrauch gemacht. MyHR 
soll neben den Routinedaten, die im Rahmen der Versorgung generiert werden, auch Laborbe- 
funde und die Ergebnisse bildgebender Verfahren einschließen, sowie Dokumentation zu Ver- 
sorgungsplanung und Entlassmanagement umfassen. Die primäre Motivation für die Umset- 
zung von myHR lag in der Verbesserung der Versorgungskoordination („care coordination“) 
und der Förderung des Patienten-Empowerment. Nichtsdestotrotz ist die Ermöglichung von 
Forschung im öffentlichen Interesse und mit dem Ziel der Verbesserung der Versorgung auch 
unter den Zielen der Initiative genannt. Bis dato sind noch nicht alle technischen Details ge- 
klärt; geplant ist ein Komitee für Data Management, welches die Beschaffung, Verarbeitung 
und Vorbereitung der myHR-Daten regeln soll. myHR-Nutzer sollen darüber hinaus die Mög- 
lichkeit haben, von der Nutzung ihrer Daten für die Forschung auszuscheiden, auch wenn sie 


die Patientenakte in Anspruch nehmen wollen. 


Dänemark 
In Dänemark wird die Gesundheitsversorgung ebenfalls durch die fünf Regionen, die die mittlere Ver- 


waltungsebene im Land darstellen (Staat, Regionen, Kommunen), geplant, koordiniert und erbracht. 
Die Sicherung der Gesundheitsversorgung der Bevölkerung über öffentliche Krankenhäuser und die 
Finanzierung privater Leistungserbringer im ambulanten Bereich entspricht auch der Hauptzuständig- 
keit der Regionen insgesamt. Hingegen fallen Maßnahmen der Gesundheitsförderung und Prävention 
sowie der öffentlichen Primärversorgung unter die Verantwortung der Kommunen. Das Gesundheits- 
system ist steuerfinanziert mit universellem Zugang; fast 40 % der Bevölkerung entscheidet sich für 
eine private Zusatzversicherung zur Deckung von Zuzahlungen oder nicht erstatteten Leistungen, wäh- 
rend ungefähr 25 % Pakete für eine größere Auswahl an privaten Leistungserbringern abschließt. 
Hausärzte haben für die große Mehrheit der Bevölkerung eine „gatekeeping“-Funktion für andere 
ambulante Leistungen und für die stationäre Versorgung (vgl. Anhang, S. 87). Primärversorgung wird 
auf Basis von Einzelleistungsvergütung bzw. Kopfpauschalen vergütet, Krankenhäuser über globale 
Budgets und Fallpauschalen. Das dänische Gesundheitssystem weist einen hohen Digitalisierungsgrad 
auf — schon 1994 wurde die Entwicklung einer eHealth-Strategie in Auftrag gegeben, die den elektro- 
nischen Austausch von relevanten Daten zwischen Leistungserbringern ermöglichen sollte. Alle Kran- 
kenhäuser und Hausärzte arbeiten inzwischen mit elektronischen Gesundheitsakten: Befunde werden 
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elektronisch übermittelt, ebenso fast alle Überweisungen und Arzneimittelverordnungen. Daten in der 
jeweiligen Gesundheitsakte werden lokal gespeichert auf Basis regionaler eHealth-Anwendungen; 
Daten aus den regionalen Plattformen werden im Dänischen Netzwerk für Gesundheitsdaten zusam- 
mengeführt. Alle Einwohner in Dänemark haben eine Personenkennzahl, die Zahl für das Zentrale 
Personenregister (Centrale Personregister, CPR), die auch in allen Registern herangezogen wird. Sta- 
tistics Denmark ist der Hauptanbieter von Registerdaten für Forschungszwecke und pflegt regelmäßig 
aktualisierte Informationen auf aggregierter Ebene, die kostenfrei zugänglich sind. Der Zugang zu 
Mikrodaten setzt eine entsprechende Qualifizierung der anfragenden Forschergruppen voraus. 

e Im Jahr 2001 haben die fünf dänischen Regionen, zusammen mit der nationalen Regierung, 
das nationale eHealth-Portal Sundhed.dk gegründet, welches das Zugangsportal zu den Daten 
des zugrunde liegenden Netzwerkes für Patienten und Leistungserbringer (ambulante Leis- 
tungserbringer, Krankenhäuser und Apotheker) darstellt (siehe Abbildung 3.1). Unter anderem 
können Patienten sich über ihre Diagnosen, Behandlungen und Befunde informieren, Termine 
buchen, Verordnungen erneuern und die eigene Adhärenz beobachten; darüber hinaus können 
sie bestimmen, welche Leistungserbringer welche ihrer persönlichen Daten einsehen können. 
Leistungserbringer können wiederum zusätzlich über die Plattform miteinander kommunizie- 
ren, Leistungen abrechnen, und relevante Evidenz (Sachbücher, wissenschaftliche Artikel, kli- 


nische Leitlinien) aufrufen. 


| Patienten | 


| 
a  .6 


Krankenháuser | 


| www.sundhed.dk | 


E 
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I | ___ | | 


| Labore | | Krankenhäuser | | Behóren | | Ärzte | | Apotheken 


Abbildung 3.1 Sundhed.dk: Datenfluss und Akteure (Quelle: www.sundhed.dk) 
e Dänemark hat, wie auch die anderen skandinavischen Länder, eine lange Tradition in der Füh- 
rung und Nutzung von klinischen und epidemiologischen Registern für die Steuerung der Ge- 


sundheitsversorgung und die Verbesserung der Versorgungsqualität. Das Regionale Programm 
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für die Entwicklung Klinischer Qualität (Regionernes Kliniske Kvalitetsudviklingspro- 
gram, RKKP) verwaltet 80-85 klinische Register mit unterschiedlichen Zielen und Populati- 
onen (z.B. Schlaganfall, Lungenkrebs, Demenz, Intensivversorgung), die unter anderem klini- 
sche Daten, Diagnosen, Behandlungen, Verordnungen, Laborbefunde, patientenberichtete 
Endpunkte und soziodemographische Informationen beinhalten. Die Register berichten regel- 
mäßig (täglich oder monatlich) für Kliniker und Manager. Aggregierte Daten werden auf jähr- 
licher Basis veröffentlicht (siehe Abbildung 3.2). Kliniker haben Zugang auf Mikrodaten für 
Patienten, die in ihrer Praxis bzw. Klinik behandelt werden, zur Validierung und Qualitätsver- 
besserung; andere Kliniker, Verwaltungspersonal und die Öffentlichkeit bekommen nur ag- 
gregierte Auswertungen der in RKKP enthaltenen Daten. Die Teilnahme ist vorgeschrieben 
für alle Leistungserbringer, die Patienten mit den passenden klinischen Indikationen behan- 
deln; für das Programm ist keine Einwilligung der Patienten zur Datenverarbeitung erforder- 
lich. 


a m 


Datenübertragung via 


Erfassung relevanter Daten oder direktes 
Internet 


Eingeben durch verantwortlichen Arzt 


Epidemiologische 
Datenanalyse 


Klinische Aktivität und Registrierung 
der Daten 


| Veröffentlichung | 


Abbildung 3.2 Kernprozesse der Danish Clinical Registries (Quelle: https://www.rkkp.dk) 


Finnland 
Das finnische Gesundheitssystem ist in seiner Verwaltungsstruktur hoch dezentralisiert, durch mehrere 


Mechanismen finanziert (Steuer, Versicherungsbeiträge, private Ausgaben) und kombiniert drei paral- 
lele Systeme für die Primärversorgung: das kommunale System, das System der nationalen Gesund- 
heitsversicherung und die arbeitsmedizinische Versorgung. Das Hauptsystem wird durch die Kommu- 
nen organisiert, die für die Primärversorgung zuständig sind und die Sekundär- und Tertiärversorgung 
durch die Mitgliedschaft in 20 Krankenhausregionen mitverantworten. Hausärzte haben auch hier eine 
Steuerungsfunktion („gatekeeping“) für spezialisierte ambulante und stationäre Versorgung, aber Pati- 


enten können auswählen, wo sie die entsprechenden Leistungen bekommen (vgl. Anhang, S. 93). 
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Durch den hohen Dezentralisierungsgrad war die Interoperabilität zwischen den breit eingesetzten 
elektronischen Gesundheitsakten bisher niedrig (Keskimäki et al. 2019); das nationale elektronische 
Gesundheitsdatenrepositorium (Kanta) wurde zwischen 2010 und 2016 stufenweise umgesetzt und 
umfasst elektronische Daten zu Verordnungen, Behandlungen, Befunden und Inanspruchnahme von 
Gesundheitsleistungen. Leistungserbringer haben darüber Zugang auf landesweiten Daten, Patienten 
über ihre eigenen Daten aus der Gesundheits- und Sozialversorgung. Mehr als 2 Millionen Finnen 
machen inzwischen davon Gebrauch. Kanta wird von der Sozialversicherungsanstalt Kela gepflegt; die 
Finnische Gesundheitsbehörde THL ist verantwortlich für die Strukturierung der Daten nachdem diese 
von den einzelnen Kontrolleuren eingetroffen sind. Das neue Gesetz für die Sekundäre Nutzung von 
Gesundheits- und Sozialdaten (2019) hat die Behörde Findata etabliert, die auf vorhandenen Daten- 
beständen, inklusive Kanta, aufbaut und mehrere Ziele für die Verbesserung der Patientenversorgung 
verfolgt („Steuerung, Überwachung, Forschung, Statistik und die Weiterentwicklung der Sektoren 
Gesundheit und Soziales“). Findata wurde im Anschluss an die finnische Präsidentschaft des Europäi- 
schen Rates 2020 gelauncht und. Die Behörde hat die Verantwortung, auf Basis von erfolgreichen 
Forschungsanträgen Stichproben aus existierenden Datenbeständen zu sammeln und zu verlinken und 


den beantragenden Forschern Zugriff auf dem verlinkten Datensatz zu gewährleisten. 


Kanada 
Die zehn kanadischen Provinzen und drei Territorien haben im Land die Hauptzuständigkeit für die 


Organisation und die Erbringung von Versorgungsleistungen sowie für die Supervision der Leistungs- 
erbringer. Sie dürfen die eigenen Versicherungssysteme mit universellem Zugang betreiben, die zent- 
ralstaatlichen Vorgaben (dem Canada Health Act von 1986) folgen müssen. Finanziert wird die öffent- 
liche Gesundheitsversorgung über Steuergelder. Ungefähr zwei Drittel aller Kanadier haben eine pri- 
vate Zusatzversicherung, die nicht erstattete Leistungen abdeckt, wie Arzneimittel oder zahnmedizini- 
sche Behandlungen. Hausärzte haben Steuerungsfunktion und können von Patienten frei gewählt wer- 
den. Das „Gatekeeping“ basiert hier vorwiegend auf finanziellen Anreizen: Fachärzte bekommen eine 
niedrigere Vergütung für Patienten ohne Überweisung. Die Primärversorgung wird vorwiegend über 
ein Einzelleistungsmodell (,,fee-for-service“) vergütet, Krankenhäuser (die Sekundär- und Tertiárver- 
sorgung anbieten) über globale Budgets (vgl. Anhang, S. 97). 

e Um die Nutzung der schon vorliegenden Mikrodaten aus unterschiedlichen Sektoren in Zu- 
sammenführung zu ermöglichen, wurde unter anderem beim Statistischen Bundesamt, Statis- 
tics Canada, das Social Data Linkage Environment (SDLE) gegründet. Über ein zentral ge- 
pflegtes ,,Schliisselregister“, welches auf Basis einer Reihe von identifizierenden Merkmalen 
erstellte neue Identifikatoren enthält (vgl. Kapitel 5, ist ein breites Spektrum von Datensätzen 
zu verknüpfen, inklusive der Arbeitskräfteerhebung (mit soziodemographischen bzw. - 
ökonomischen Mikrodaten), nationalen Gesundheitsbefragungen (mit gesundheitlichen, ver- 
sorgungsrelevanten, soziodemographischen bzw. -ókonomischen Mikrodaten), der Kranken- 
hausentlassung-Datenbank (mit Mikrodaten zu erbrachten Leistungen und Diagnosen), Zen- 
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sus-Daten, umweltbezogenen Makrodaten und einer Reihe von Provinzdaten über Kriminali- 
tät, Bildung, psychische Gesundheit usw. Demnach ist SDLE keine integrierte Datenbank an 
sich, sondern eine sichere Umgebung, welche die Verlinkung anderer Datenbestände ermög- 


licht; diese wurden bisher auch häufig für wissenschaftliche Forschungsarbeiten genutzt. 


Auch auf der Ebene der Provinzen gibt es wichtige Verlinkungsinitiativen, die in diesem Gutachten 


herangezogen werden. Als Vorteile dieser Initiativen gelten die große Abdeckung der jeweiligen Be- 


völkerung (Repräsentativität) und die lange Zeitspanne bestimmter Datenbestände: 
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Das ehemalige Institute for Clinical Evaluative Sciences in Ontario wird inzwischen nur mit 
seinem Akronym ICES benannt und hält ein Repositorium von Datensätzen, die für For- 
schungs- und Analysezwecke zur Verbesserung der Gesundheit der Einwohner von Ontario 
verlinkbar sind; 94 davon sind öffentlich sichtbar im Datenrepositorium. Dazu zählen Daten 
zu den Interaktionen der Einwohner von Ontario mit dem Gesundheitssystem (Mikrodaten zur 
Gesundheitsversorgung), Mikrodaten aus Befragungen zu Gesundheit, Inanspruchnahme von 
Leistungen, Soziodemographie und Ökonomie, Migrationsdaten (soziodemographisch und - 
ökonomische Mikrodaten), und Registerdaten (u.a. Krebs-, Schlaganfall-, und Mukoviszidose- 
register). Makrodaten aus dem Zensus liefern soziodemographische Informationen auf aggre- 
gierter Ebene, die über geographische Merkmale mit Mikrodaten verknüpft werden können. 
Darüber hinaus ermöglicht ICES die Verknüpfung von Daten aus neuen Forschungsprojekten, 
die auch außerhalb des Institutes entstanden sind, zu den vorhandenen Datenbeständen. 

Im Gegensatz zu ICES hat Population Data British Columbia (PopData BC) keine eigene 
Forschungsagenda, ermöglicht es aber auch externen Forscher die eigenen Primärdaten mit 
den in seiner gesicherten Forschungsumgebung gehaltenen Datenbeständen zu verknüpfen. 
Diese Datensätze umfassen Mikrodaten zur Inanspruchnahme von Leistungen (inklusive Arz- 
neimittelverordnungen und Krankenhausentlassungen), Vitalstatistiken, Migrationsdaten, ar- 
beitsmedizinische Abrechnungsdaten und Bildungsdaten. Einkommensdaten werden per Post- 
leitzahl aggregiert und in Strata aufgeteilt. Auch dieses Angebot wurde bisher in mehreren 
Forschungsvorhaben eingesetzt. 

Letztlich wird in diesem Gutachten auch das Manitoba Population Research Data Reposi- 
tory an der Universität Manitoba herangezogen; die Universität forscht selbst auf Basis der 
Daten und kann auch Externen den Zugang ermöglichen. Die Daten stammen von mehreren 
lokalen, provinziellen und nationalen Quellen und enthalten Gesundheitsdaten auf individuel- 
ler Ebene (aus mehreren Registern), Gesundheitsversorgungsdaten, Daten zu Bildung und Jus- 
tiz, Zensusdaten und eine Reihe von spezifischeren Sätzen (vgl. Anhang, S. 102). Die Daten 
werden de-identifiziert, bevor sie das Repositorium erreichen (für einen Vergleich unter- 
schiedlicher Ansätze zur De-Identifikation von Mikrodaten siehe Kapitel 5). Nur aggregierte 


Daten dürfen in Publikationen und Präsentationen benutzt werden. 


Neuseeland 
Neuseeland hat ein nationales, steuerfinanziertes Gesundheitssystem, welches durch die zwanzig Be- 


zirksgesundheitsbehörden (,,District Health Boards“) verwaltet wird. Es ist ein universeller Zugang zu 
Gesundheitsleistungen für Einwohner erreicht; ungefähr ein Drittel der Bevölkerung hat eine private 
Zusatzversicherung, vorwiegend um Zuzahlungen bzw. nicht erstattete Leistungen abzudecken. Eine 
Registrierung bei einem Hausarzt ist nicht zwingend erforderlich und Patienten haben zumindest theo- 
retisch freie Wahl. Hausärzte haben auch hier Gatekeeping-Funktion und werden zu 50 % durch 
Kopfpauschalen aus dem öffentlichen System und zu 50 % auf Basis von Einzelleistungen über Pati- 
entenzuzahlungen vergütet. Krankenhäuser werden über globale Budgets finanziert (vgl. Gauld 2019). 
Daten aus dem Gesundheitssystem fließen zusammen mit Daten aus anderen Bereichen (Sozialdienst, 
Bildung, Einkommen und Beschäftigung, Wohnverhältnisse, Justiz, Soziale Verhältnisse, Bevölke- 
rungsstatistik) in eine integrierte Dateninfrastruktur (Integrated Data Infrastructure, IDI), die vom neu- 
seeländischen statischen Amt gepflegt wird. Die IDI ist grundsätzlich eine große Forschungsdaten- 
bank, die mit dem Ziel gegründet wurde, die bestmögliche Nutzung vorhandener Daten für die Beant- 
wortung komplexer Fragestellungen zu unterstützen. Die IDI-Datenbestände mit Gesundheitsbezug 
sind Box 3.1 zu entnehmen. 

Innerhalb von Datenbereichen können identifizierende Merkmale genutzt werden, um Daten auf der 
Mikroebene zu verlinken (zum Beispiel der „National Health Index Number“ für den Gesundheitssek- 
tor); um Daten über unterschiedliche Bereiche hinweg zu verlinken wird ein probabilistisches Verfah- 
ren eingesetzt (vgl. Kapitel 5). Es gibt die Möglichkeit, über geographischen Bezug auch andere Da- 
ten, die nicht in der IDI aufbewahrt sind, mit IDI-Daten zu verknüpfen, wie zum Beispiel Umweltda- 
ten. Die IDI benutzt das sogenannte „five safes“-Framework und Forscher, die Zugang auf IDI-Daten 
haben möchten, müssen sich daranhalten: „safe people, safe projects, safe settings, safe data, safe out- 
put“. Die Daten der IDI werden bereits von mehreren Forschergruppen in Anspruch genommen (Milne 
2019). Unter den im Gutachten betrachteten Fallstudien vertritt die IDI den höchsten Grad der Konso- 


lidierung von Daten. 
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Box 3.1 Gesundheitsbezogene Daten in der IDI 
e Ergebnisse aus dem Gesundheitscheck im Vorschulalter (4 Jahre, „B4 School Checks“) — ab 2011 
e Krebsregistrierungen — ab 1995 
e Chronische Erkrankungen — ab 2007 
e Abrechnungsdaten der Hausárzte — ab 2002 
„Health tracker“ (eine Art Gesundheitszensus des Gesundheitsministeriums) — 2006-14 


e Impfungen — ab 2006 

e Laborabrechnungen — ab 2003 

e Leistungen für Wochenbett/Neugeborene — ab 2003 

e Todesursachenstatistik — ab 1988 

e National Booking Reporting System — ab 2003 

e Pflegebedürftigkeit (SOCRATES) 

e Abrechnungsdaten fiir ambulante Patienten — ab 2007 

e Verordnungen — ab 2005 

e Registrierungen mit Hausarzten — ab 2003 

e Demographische Informationen aus dem National Health Index — ab 2004 

e Psychische Gesundheit (nur Überweisungen, abgerechnete Leistungen und demographische Informatio- 
nen; keine Diagnosen oder Befunde) — ab 2008 

e Private Krankenhausentlassungen — ab 2001 

Öffentlich finanzierte Krankenhausentlassungen — ab 1988 


Niederlande 
Das niederländische Gesundheitssystem wird durch Versicherungsbeiträge und Steuergelder finan- 


ziert. Alle Einwohner müssen eine gesetzliche Gesundheitsversicherung mit einer privatrechtlichen 
Krankenkasse abschließen. Die Beiträge werden zentral gesammelt und auf Basis einer Risikoadjustie- 
rungsformel an die Kassen verteilt. Ungefähr 85 % der Bevölkerung hat darüber hinaus eine private 
Zusatzversicherung, die Zuzahlungen bzw. nicht erstattete Leistungen (wie Zahnmedizin) abdeckt. 
Eine Überweisung vom Hausarzt ist für ambulante fachärztliche und stationäre Versorgung notwendig 
(„gatekeeping“). Obwohl die Versicherten keine Registrierungspflicht haben, schreiben sich die meis- 
ten bei ihren Hausärzten freiwillig ein. Diese werden über eine Kombination von Kopfpauschalen und 
leistungsorientierten Zahlungen vergütet. Fachärztliche Versorgung ist Krankenhausbasiert und wird 
je nach konkreter vertraglicher Situation entweder auf Einzelleistungsbasis oder über Fallpauschalen 
finanziert. Alle Patienten verfügen über eine eindeutige Kennziffer („Burgerservicenummer“). An 
einem zentralen Informationsverwaltungssystem wird gearbeitet (vgl. Wammes et al. 2019); fast alle 
Hausärzte und Krankenhäuser benutzen elektronische Gesundheitsakten, aber die Interoperabilität ist 
verbesserungsbedürftig. 

e Die Forschungsinstitution Nivel betreibt eine Datenbank für die Primärversorgung (Nivel 
Primary Care Database (Nivel PC Database; Nivel Zorgregistraties eerste lijn), welche rou- 
tinemäßig gesammelte Daten zu gesundheitlichen Problemen und zur Inanspruchnahme (Di- 
agnosen, Ergebnisse klinischer Untersuchungen) von Gesundheitsleistungen aus der Primär- 
versorgung zusammenbringt, um die Gesundheit und die Gesundheitsversorgung der Bevölke- 
rung zu monitoren. Das Patientenkollektiv des Panels der teilnehmenden Praxen wird als re- 


präsentativ gesehen; neben den Hausärzten nehmen auch andere Leistungserbringer der Pri- 
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märversorgung teil, inklusive Apotheken, Physiotherapeuten, Psychotherapeuten und Ernäh- 
rungsberater. Teilnehmende Leistungserbringer bekommen regelmäßige Berichte mit aggre- 
gierten Daten und Nivel nutzt die Datenbank für eigene Forschungszwecke; auch externe For- 
scher können die Nutzung der Daten beantragen, die in anonymisiertem Format bekommen 
können. Es ist möglich, die Daten über Pseudonyme auf Basis der Burgerservicenummer mit 
anderen Datenbeständen und soziodemographische Informationen zu verknüpfen. 

e Eine weitere interessante Möglichkeit für die Nutzung von verknüpften Daten stellt in den 
Niederlanden PHARMO dar, eine unabhängige Forschungsorganisation, die seit ihrer Grün- 
dung im Jahr 1999 ein breites Netzwerk an Datenbanken aufgebaut hat. Hier können je nach 
Forschungsfrage bzw. Antrag angepasste, indikationsspezifische „Kohorten“ erstellt werden 
und Mikrodaten aus mehreren Quellen verlinkt werden, inklusive Daten aus Hausarztpraxen, 
ambulanten und stationären Apotheken, Laboren, Krebs-, Mortalitäts- und Neonatalregister, 
Pathologiebefunden, Krankenhausentlassungen und patientenberichtetete Endpunkte. PHAR- 
MO forscht selbst zu bestimmten Fragestellungen, hauptsächlich hinsichtlich Pharmakoepi- 
demiologie und der Wirkung von Arzneimitteln nach Marktzugang; externe Forscher können 
die Daten kostenpflichtig beantragen und erhalten einen maßgeschneiderten Datensatz zur Be- 


arbeitung. 


Österreich 
Das Gesundheitssystem in Österreich wird aus mehreren Quellen finanziert: der Bund, die neun Län- 


der sowie die Sozialversicherungsträger tragen zum Gesamtbudget bei. Einkünfte für das System 
stammen aus den allgemeinen Steuereinnahmen (40 %) und den Beiträgen der gesetzlich vorgeschrie- 
benen sozialen Krankenversicherung (60 %), die mehr als 99 % der Bevölkerung umfassen. Die Ver- 
fügbarkeit der Krankenhausversorgung (ambulant und stationär) wird von den Ländern gesichert und 
großteils finanziert. Die ambulante Primär- und Sekundärversorgung wird durch Gesamtverträge zwi- 
schen dem Hauptverband der Versicherungsträger und den Krankenkassen geregelt. Hausärzte haben 
keine formale „Gatekeeping“-Funktion und ein Großteil der Versorgung findet im Krankenhaus statt. 
Patienten haben freie Wahl an Hausärzten, Fachärzten und Krankenhäusern. Die krankenkassenfinan- 
zierte ambulante Versorgung wird über eine Mischung aus Kopfpauschalen und Einzelleistungsvergü- 
tung finanziert; privat praktizierende Ärzte müssen zunächst direkt von den Patienten bezahlt werden, 
die Kosten können aber nachträglich und anteilig von den Krankenkassen zurückerstattet werden. 
Akutkrankenhäuser werden auf Basis von Fallpauschalen vergütet. Die österreichische e-Health- 
Strategie von 2007 hatte das Ziel, die Integration und Kompatibilität von bestehenden Informations- 
systemen unterschiedlicher zu verbessern und einen stabilen Informationsaustausch über die elektroni- 
sche Versichertenkarte zu ermöglichen. 
e Als Grundbestandteil der e-Health Strategie 2007 wurde auch die Elektronische Gesund- 
heitsakte (ELGA) eingeführt, die es ermöglichen sollte, Gesundheitsinformationen von Pati- 
enten (z. B. medizinische Untersuchungen, Arzneimittelverordnungen, Blutgruppe, Labor- 
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und Radiologiebefunde, Entlassungsbriefe aus dem Krankenhaus) den Patienten selbst und be- 
rechtigten Leistungserbringern strukturiert zur Verfügung zu stellen und historisch darzustel- 
len. Die gesetzliche Grundlage für die Einführung von ELGA wurde im Januar 2013 geschaf- 
fen und 2014 wurde das ELGA-Portal aktiviert. Über das Portal können Patienten und Leis- 
tungserbringer auf die beschriebenen Daten zugreifen. Patienten können den Zugang zu aus- 
gewählten persönlichen Gesundheitsdaten einschränken und einsehen, wer ihre individuellen 
Eintragungen aufgerufen hat. Patienten werden für ELGA automatisch angemeldet (kein „opt 
in“ erforderlich, vgl. Kapitel 7), können sich aber wieder abmelden. Das vollständige, landes- 
weite Rollout von ELGA wird 2021 erwartet (Bachinger et al. 2018). 

e Das Österreichische Gesundheitsinformationssystem (ÖGIS) wird für die Gesundheitsbe- 
richterstattung und Planung eingesetzt und als geografisches Informationssystem (GIS) konzi- 
piert. Die im System verfügbaren Daten können aggregiert als Karten und Zeitreihen darge- 
stellt werden und umfassen Bereiche wie Sterblichkeit, Krebsinzidenz, Prozeduren, Kranken- 
hausdichte, subjektiver Gesundheitszustand). Konkret sind Mikrodaten aus dem DRG-System 
(inkl. Soziodemographischen Informationen, Diagnosen, abgerechnete Leistungen), aus der 
ambulanten Versorgung (Arztbesuche, abgerechnete Leistungen) und Pflegeleistungen einge- 
schlossen. Makrodaten aus der Todesursachenstatistik, Krebsstatistik, Krankenhausstatistik, 
Statistik der ambulanten Leistungserbringer, Befragungen zu Gesundheitsverhalten, subjekti- 
ver Gesundheitseinschätzung und Nutzung des Gesundheitssystems (aggregiert nach Alter, 
Geschlecht und Region der Befragten), demographische und sozioökonomische Daten sowie 
Daten zur Zugänglichkeit sind ebenso eingeschlossen. Das Regionale Gesundheitsinforma- 
tionssystem (REGIS) ist Teil von ÖGIS und ermöglicht die regionale Analyse der ÖGIS- 
Daten in der Form von Karten. 

e Vor dem Hintergrund der aktuellen Diskussion in Deutschland ist eine weitere österreichische 
Initiative hier erwähnenswert: das e-Rezept wird im Jahr 2020 pilotiert, um Papierrezepte ab- 
zulösen. Die Daten aller Arzneimittelverordnungen sollen ins System der elektronischen Ge- 
sundheitskarte einfließen, in zwei separaten Datenzentren gespeichert werden und bei Bedarf 
zusammengeführt werden. Die Zugänglichkeit der Daten für die Forschung ist wegen der frü- 


hen Implementierungsphase noch nicht ausreichend geklärt. 


Schweden 
In Schweden sind es die 21 Provinzen (12 Provinziallandtage und 9 Regionalbehörden), die für die 


Bereitstellung der Gesundheitsversorgung zuständig sind. Kommunen hingegen tragen die Verantwor- 
tung für Pflege und Sozialleistungen. Einkünfte für das System kommen von lokalen und regionalen 
Steuern; ein System für die regionale Neuverteilung der Einkünfte erlaubt es den Regionen, die Be- 
dürfnisse ihrer Einwohner zu erfüllen. Nur ca. 10 % der Bevölkerung haben private Zusatzversiche- 
rungspakete für schnelleren Zugang zu fachärztlicher Versorgung sowie nicht erstattete Leistungen 
(Wahlleistungen). Die Primärversorgung von Patienten wird von privaten (40 %) oder öffentlichen 
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(60 %) Leistungserbringern (Hausärzten, Pflegekräften, Hebammen, Psychologen, Physiotherapeuten 
und Gynäkologen, die häufig in Gemeinschaftspraxen organisiert sind) getragen. Eine Registrierung 
ist in den meisten Regionen erforderlich aber Hausärzte haben keine strenge Steuerungsfunktion (,,Ga- 
tekeeping“); meistens registrieren Patienten sich bei einer (Gemeinschafts-) Praxis cher als bei einem 
Arzt oder einer Ärztin. Leistungsanbieter in der Primärversorgung werden über eine Mischung aus 
hauptsächlich Kopfpauschalen, Einzelleistungsvergütung, und Leistungsorientierten Zahlungen vergü- 
tet. Ambulante und stationäre fachärztliche Versorgung findet in öffentlichen Krankenhäusern oder 
privaten Kliniken statt; sie wird über Fallpauschalen (DRGs) vergütet, die um leistungsorientierte 
Komponenten sowie Kosten- bzw. Volumendeckelungen ergänzt werden. Ähnlich wie in Dänemark 
und in anderen nordischen Ländern hat Schweden eine gut etablierte Datenbasis in Form von epidemi- 
ologischen und klinischen Registern. 

e Um die Forschung in klinischen Registern, auch mit Daten aus mehreren Datenbeständen zu 
ermöglichen, hat der Schwedische Forschungsrat die Stelle Registerforsking etabliert, die 
Forscher dabei unterstützen soll, die richtigen Daten zu finden und zu verarbeiten. Ein elekt- 
ronisches Tool (Register Utiliser Tool, RUT) wird aktuell entwickelt, um diesen Prozess 
noch weiter zu vereinfachen; das Tool wird nicht direkt auf Mikrodaten zugreifen können. Die 
Register, die über Registerforsking erreichbar sind, umfassen Daten zu Gesundheit und Ge- 
sundheitsversorgung, Steuer, Bildung, Justiz, Soziodemographie usw. Die persönliche Identi- 
fikationsnummer (PIN) kann als identifizierendes Merkmal für die Verlinkung von Daten über 
mehrere Register hinweg fungieren. 

e Uber die Registerforschung hinaus bietet auch die elektronische Patientenakte Schwedens 
(Journalen, ehem. SUSTAINS) interessante Impulse. Leistungserbringer in Schweden haben 
freie Wahl, welche elektronische Gesundheitsakte sie nutzen. Um die Interoperabilität zwi- 
schen unterschiedlichen Systemen zu ermöglichen, hat Schweden eine nationale Plattform, die 
Health Information Exchange (HIE), implementiert, die es Patienten erlaubt, alle ihre Informa- 
tionen als eine virtuelle Patientenakte zu sehen, obwohl sie aus unterschiedlichen Systemen 
stammen. Alle Daten, die im Rahmen gesetzlich finanzierter medizinischer und zahnmedizin- 
sicher Leistungen erhoben wurden, fließen in Journalen ein, einschließlich verordneter Medi- 
kamente, Laborbefunde, Diagnosen, Überweisungen, Impfungen, und Wochenbett. Leistungs- 
erbringer können sich weigern, ihre Daten für Journalen bereitzustellen, auch wenn die Pro- 


vinz sich für die Umsetzung der Akte entschieden hat. 


Südkorea 
Das südkoreanische Gesundheitssystem ist grundsätzlich ein nationales Krankenversicherungs- 


system; lediglich die Ausgaben für 3% der Bevölkerung werden durch Steuermittel finanziert. Die 
Nationale Krankenversicherung (National Health Insurance, NHI) erhält einkommensbasierte Beiträge 
von Arbeitgeber und Arbeitnehmer bzw. Selbstständigen und finanziert entsprechend die Gesundheits- 
ausgaben Ihrer Versicherten. Obwohl der Leistungskatalog relativ breit ist, können die Zuzahlungen 
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für bestimmte Leistungsarten hoch sein. Mehr als 60 % der Bevölkerung haben eine private Zusatzver- 
sicherung für Zuzahlungen und nicht erstattete Leistungen. Die Primärversorgung findet in Versor- 
gungszentren statt, die vorwiegend privat sind und über Einzelleistungsvergütung finanziert werden. 
Auch in Krankenhäusern tätige Ärzte können für die Primärversorgung der Patienten Leistungen er- 
bringen. Akutkrankenhäuser werden neben Einzelleistungen über Fallpauschalen für sieben Diagnose- 
gruppen vergütet; Pflegeleistungen werden über Tagespauschalen finanziert. Es gibt keine Steuerungs- 
funktion („Gatekeeping“) in der Primärversorgung. Der Dienst der nationalen Krankenversicherung 
(National Health Insurance Service, NHIS) zieht die Beiträge ein und vergütet Leistungserbringer, 
während der Prüfungs- und Bewertungsdienst der Krankenversicherung (Health Insurance Review 
and Assessment Service, HIRA) die beanspruchten abgerechneten Leistungen prüft, die Angemes- 
senheit der geleisteten Versorgung bewertet und für die Gestaltung des Leistungskatalogs und der 
Zuzahlungen zuständig ist. Als zentrale Stellen für die Bearbeitung der abgerechneten Leistungen für 
die versicherte Bevölkerung Südkoreas haben NHIS/HIRA umfangreiche Daten zu Untersuchungen, 
Behandlungen, verordneten Arzneimitteln, Prozeduren und Diagnosen von ca. 50 Millionen Men- 
schen, zusätzlich zu deren soziodemographischen Charakteristika und Informationen zu den beteilig- 
ten Leistungserbringern. Die HIRA-Daten sind mit anderen Datenbeständen verlinkbar, so dass feh- 
lende Informationen (Befunde, Todesursachen, Krankheitsschwere usw.) ergänzt werden können. Die 
HIRA-Daten wurden erst 2009 für Forschungszwecke freigeschaltet; seitdem hat ihre Nutzung zuge- 
nommen, so dass Südkorea unter den Ländern mit dem höchsten OECD-Index ist (vgl. Tabelle 1.2). 
Mögliche Themenbereiche für die Forschung auf Basis von HIRA-Daten umfassen Adhärenz, Ver- 
schreibungsmuster, Inanspruchnahme von Leistungen, Krankheitslast, unerwünschte Ereignisse, und 
die Bewertung von Politikmaßnahmen. Obwohl HIRA-Daten eine „Anamnese“ der ambulanten und 
stationären Versorgung der Versicherten von Geburt an beinhalten (vgl. Kapitel 4), sind nur die Daten 


der jeweils letzten 5 Jahre für Forschungszwecke freigeschaltet. 


Vereinigtes Königreich 
Der National Health Service (NHS) im vereinigten Königreich wurde mit dem Anspruch gegründet, 


dass Gesundheitsversorgung den Bedarf aller Einwohner entspricht, bedarfsgerecht und unabhängig 
der Zahlungsfähigkeit von Patienten erbracht wird, und zum Zeitpunkt der Inanspruchnahme von Leis- 
tungen kostenfrei ist. Seit seiner Gründung 1948 ist das System entlang dieser Grundprinzipien wei- 
terentwickelt worden. Es besteht aus vier eigenständigen Organisationen für die jeweiligen Landsteile 
des Vereinigten Königreichs (NAS England, NHS Wales, NHS Scotland, Health and Social Care 
Northern Ireland), die unabhängig funktionieren, aber den gemeinsamen Grundprinzipien folgen. Das 
System wird über Steuergelder finanziert und ist bekannt für die zentrale Rolle der Hausärzte in der 
Primärversorgung, die als Eingangsstelle für Patienten und „Gatekeeper“ für die weitere Versorgung 
im System agieren. In England sind es NHS England und die mehr als 200 Clinical Commissioning 
Groups (CCGs) und in Schottland die insgesamt 21 NHS Boards, die für die Planung und Bereitstel- 


lung von Versorgungsleistungen zuständig sind. In England werden Hausärzte über eine Mischung 
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von Kopfpauschalen, Einzelleistungsvergütung und leistungsorientierten Zahlungen finanziert, wäh- 


rend Krankenhäuser über Fallpauschalen vergütet werden, mit gesonderten Budgets für psychische 


Gesundheit, Ausbildung und Forschung. In Schottland wurde das sogenannte „Purchaser-Provider- 


Split“ nicht umgesetzt, so dass die Vergütung von Leistungen integrierter verläuft. 


Die wichtige Rolle der Hausärzte spiegelt sich auch in der international bekannten Datenbank 
Clinical Research Practice Datalink (CPRD) wider, welche Daten aus Hausarztpraxen im 
Vereinigten Königreich auf Basis der jeweiligen elektronischen Praxisinformationssysteme 
zusammenführt. CPRD wird von der Nationalen Arzneimittel- und Medizinprodukteagentur 
(Medicines and Healthcare products Regulatory Agency, MHRA) und dem Nationalen Zent- 
rum für Gesundheitsforschung (National Institute for Health Research, NIHR) getragen. Der 
CPRD sammelt de-identifizierte Mikrodaten von einem Netzwerk aus Hausarztpraxen, die 
sich für eine Teilnahme entschieden haben und die jederzeit auch wieder ausscheiden können 
(vel. Kapitel 4). Die gesammelten Daten beinhalten demographische Informationen, Angaben 
zu Leistungserbringern, klinischem Erscheinungsbild (Diagnose, Symptome, klinische Zei- 
chen), Überweisungen, Impfungen, Laborbefunde und Arzneimittelverordnungen. Daten aus 
englischen Praxen können mit weiteren Datensätzen verknüpft werden, so dass der Versor- 
gungsvorgang jenseits der Primärversorgung erforscht werden kann; Praxen müssen vorab ei- 
ner Teilnahme im Verlinkungsprogramm zugestimmt haben. Die Datenbestände, die aktuell 
zur Verlinkung herangezogen werden können, sind in Box 3.2 aufgeführt. Die Verlinkung 
übernimmt NHS Digital; die personenbezogene NHS-Nummer kann als eindeutiges identifi- 
zierendes Merkmal eingesetzt werden, aber entsprechend der zu verlinkenden Daten werden 
auch andere Merkmale herangezogen (vgl. Kapitel 5). Im Jahr 2019 umfassten die CPRD Da- 
ten 42 Millionen Patienten und wurden für mehr als 2000 extern begutachtete wissenschaftli- 
che Publikationen genutzt, die unter anderem Fragen der Arzneimittelsicherheit, des Arznei- 
mittelkonsums, der Effektivität von gesundheitspolitischen Maßnahmen, der Organisation der 
Leistungserbringung und der Entwicklung von Risikofaktoren erforscht haben. 

Schottland hat in den letzten Jahren mit einer Reihe von strategischen Maßnahmen großen 
Wert auf die Weiterentwicklung und Nutzung von routinemäßig erhobenen Daten gelegt. Der 
Dienst für Forschung mit elektronischen Daten und Innovation (electronic Data Research 
and Innovation Service, eDRIS) stellt ein „One-Stop-Shop“ für die Nutzung vorhandener 
administrativer und gesundheitlicher Daten dar. Es soll Forscher und Politikanalytiker dabei 
helfen, die richtigen Daten-sätze für ihr Vorhaben zu identifizieren, die Forschungsfragen zu 
operationalisieren und Zugang zu verlinkten Daten zu bekommen. Alle administrativen Daten 
im öffentlichen Besitz können für die Forschung beantragt werden, oder auch für Planungs- 
bzw. Evaluationsprozesse im Gesundheitswesen. Die Verlinkung erfolgt über eine Vertrauens- 
stelle auf Basis eines sogenannten „Population Spine“ (vgl. Kapitel 5), welches die Stammda- 


ten aller Personen enthält, die mit NHS Scotland in Kontakt gekommen sind. 
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Box 3.2 Datenbestände, die mit CPRD-Daten verlinkt werden können 
e Hospital Episode Statistics (HES) Daten 
o für stationäre Patienten 
o HES-Daten für ambulante Leistungen 
o HES- Daten aus den Notfallambulanzen 
o HES Diagnostic Imaging Dataset 
e HES Patient Reported Outcomes Measures (PROMs) 
e Todesregistrierungen des statistischen Amtes 
e Krebsdaten von Public Health England (PHE): 
o Krebsregistrierungen 
Systemic Anti-Cancer Therapy (SACT) Dataset 
National Radiotherapy Dataset (RTDS) 


Cancer Patient Experience Survey (CPES) 

Quality of Life of Cancer Survivors in England: Pilot Survey (QOLP) 

Quality of Life of Colorectal Cancer Survivors in England: Patient Reported Outcome 

Measures Survey (QOLC) 

e Psychische Gesundheit (Mental Health Dataset, MHDS) 

e Sozioökonomische Daten mit kleinräumigem Bezug: Index of Multiple Deprivation IMD), Townsend 
Deprivation Index, Carstairs Index, Patient postcode linked deprivation measures, Practice postcode 
linked deprivation measures, Rural-Urban Classification 
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e Analog zum CPRD (siehe oben) wurde in Schottland das Scottish Primary Care Informati- 
on Resource (SPIRE) gegründet, um Daten aus schottischen Hausarztpraxen für Forschungs- 
und Analysefragen zusammenzuführen. Diese können über eDRIS mit weiteren Datenbestän- 
den des schottischen NHS verknüpft werden. Unter anderem sollen SPIRE-Daten zur Bestim- 
mung der Versorgungsqualität herangezogen werden und den Vergütungsrahmenvertrag 
(GMS Contract) informieren (vgl. das beendete Quality and Outcomes Framework, ISD Scot- 
land 2019a). SPIRE-Daten werden auf Anfrage aus dem Praxisinformationssystem teilneh- 
mender Praxen extrahiert (die Software wird von der Firma MSDi erstellt und betrieben) und 
umfassen soziodemographische Daten der Patienten, Befunde, Prozeduren, Arzneimittelver- 
ordnungen, Diagnosen, Inanspruchnahme von Leistungen. Nur strukturierte Informationen 
können für Forschungszwecke extrahiert werden, nie die gesamte elektronische Gesundheits- 
akte; somit werden zum Beispiel Notizen aus Arzt-Patienten-Diskussionen nicht weitergege- 
ben. Potentiell identifizierende Daten müssen pseudonymisiert werden, bevor sie die Praxis 
verlassen (vgl. Kapitel 5). Alle Praxen in Schottland nehmen grundsätzlich in SPIRE teil, es 


sei denn sie entscheiden sich auszuscheiden (,,opt-out“). 


Vereinigte Staaten 
Das US-Amerikanische Gesundheitssystem ist für seine Fragmentierung hinsichtlich der Finanzierung 


und der Organisation der Leistungserbringung und des fehlenden universellen Zugangs zu Gesund- 
heitsleistungen bekannt. Zwei Drittel der Bevölkerung haben eine private Krankheitsversicherung mit 
variierenden Leistungskatalogen und Zuzahlungsanforderungen. Die Mehrheit der privat versicherten 


Personen sind über arbeitgeberfinanzierte Pläne abgedeckt (56 % der Bevölkerung im Jahr 2017, vgl. 
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Commonwealth Fund 2019). Ungefähr ein Drittel der Bevölkerung ist über die öffentlichen Sozialver- 

sicherungssysteme abgedeckt; die wichtigsten sind Medicare für Personen über 65 Jahre (17 % der 

Bevölkerung) und Medicaid für Personen mit niedrigem Einkommen (19 % der Bevölkerung). Durch 

den 2010 verabschiedeten Affordable Care Act wurde der individuelle Erwerb von Gesundheitsversi- 

cherungspaketen für alle sonst nicht versicherte Personen eingeführt und dies hat zu einer Abnahme 
der Nichtversichertenquote beigetragen (8,8 % im Jahr 2017). Das Mandat wurde inzwischen wieder 
abgeschafft. In der Primärversorgung sind überwiegend in kleinen Einzel- oder Gruppenpraxen tätige 

Ärzte aktiv; sie haben meistens keine „Gatekeeping“-Funktion und Patienten haben freie Wahl, solan- 

ge die Leistungserbringer dem Netzwerk ihrer Versicherung zugehören. Die Vergütung variiert je nach 

Versicherungssystem (vgl. Rice et al. 2013). In der Primärversorgung umfasst sie vorwiegend Einzel- 

leistungszahlungen (mit regulierten oder verhandelten Gebühren, für die öffentlich bzw. privat finan- 

zierten Leistungen entsprechend), Kopfpauschalen und leistungsorientiere Anreize (in manchen Versi- 
cherungssystemen). Fachärztliche Versorgung findet in Arztpraxen und Krankenhäusern statt. Große 

Unternehmen bieten integrierte Versorgungsysteme an, die Gesundheitsversicherung, ambulante und 

stationäre Gesundheitsversorgung im „Managed Care“-Modell zusammenbringen. Das größte davon 

ist aktuell Kaiser Permanente, mit Niederlassungen in acht Staaten und mehr als 12 Millionen Versi- 
cherten. 

Ähnlich wie der Aufbau des Systems ist auch die Verfügbarkeit von Daten für die Forschung fragmen- 

tiert; nichtsdestotrotz mangelt es nicht an Initiativen, die der Transparenz und der Ermöglichung von 

Forschungs- und Analyseaktivitäten dienen sollen. Selektiv werden in diesem Gutachten folgende 

weiter beleuchtet: 

e Die Centers for Medicare and Medicaid Services sind Teil des Department of Health and Hu- 
man Services (entspricht dem Ministerium für Gesundheit und Soziales auf Bundesebene) und 
pflegen mehr als 400 Datensätze (CMS Data) zum öffentlich geregelten Versorgungsgeschehen 
im amerikanischen System. Diese umfassen sozio-ökonomische/demographische, Gesundheits- 
und Gesundheitsversorgungsdaten auf Individual- und Makroebene. Viele dieser Datensätze sind 
auf aggregierter Ebene frei zugänglich als „public use files (PUFs)” über data.cms.gov. De- 
identifizierte Mikrodaten sind entweder als „limited data set (LDS)“ oder als „research identifiable 
files (RIFs)” auf Antrag zugänglich; letztere können je nach Forschungsfrage maßgeschneidert 
werden, bevor sie die Institution verlassen und ihre Nutzung ist viel kostenintensiver im Vergleich 
zu den LDS (vgl. Abbildung 4.1). Die CMS-Datenbanken beinhalten mehrere identifizierende 
Merkmale, die für eine Verlinkung herzangezogen werden können; CMS veröffentlich aber kein 
Data Dictionary dazu (vgl. Kapitel 4). 

e Auf Basis der elektronischen Gesundheitsakten (EPIC) der bei Kaiser Permanente erfassten Pati- 
enten bringt das Kaiser Health Connect System Informationen aus unterschiedlichen Ebenen zu- 
sammen: klinische Befunde, Untersuchungen, Diagnosen und Behandlungen mit Terminbuchun- 


gen, Registrierungen und Abrechnungsdaten. Es ist somit das größte private klinische Informati- 
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onssystem der Welt. Es bietet zwei Oberflächen an: MyChart, auf dem Patienten ihre Informatio- 
nen einsehen können; und EpicCare, das von Gesundheitspersonal für die koordinierte Versorgung 
des Patienten eingesetzt wird. 

Der Affordable Care Act von 2010 hat unter anderem das Patient-Centred Outcomes Research 
Institute (PCORI) gegründet. PCORI leitet die Initiative PCORnet (National Patient-Centered 
Clinical Research Network); diese hat das Ziel, die Durchführung von klinischer Forschung auf 
Basis großer Datenbestände und starker partizipativer Netzwerke zu vereinfachen und zu optimie- 
ren, indem auch die Bedürfnisse der Patienten expliziter berücksichtigt werden. PCORnet stellt ein 
Dachnetzwerk von sogenannten “Research Networks” dar; aktuell (2019) sind neun von diesen bei 
klinischen Versorgungssystemen und zwei bei Versicherungsorganisationen angesiedelt; die ur- 
sprünglich gleichermaßen eingebundenen patientengesteuerten Netzwerke werden ab April 2019 
beratend herangezogen. PCORNet funktioniert über ein gemeinsames Datenmodell (Common Da- 
ta Model, CDM), welches für die Aufbereitung der Daten teilnehmenden Partner ausschlaggebend 
ist. Das PCORnet Coordinating Center verwaltet das sogenannte ,,Front Door“, welches es poten- 
tiellen Datennutzern erlaubt, über die Möglichkeit der PCORnet Daten beraten zu werden und 
Nutzungsanträge zu stellen. Die PCORnet-Daten umfassen demographische Variablen, Beobach- 
tungsdauer im Netzwerk, Kontakte mit dem Gesundheitssystem, Diagnose, Prozeduren und diag- 
nostische Tests, Vitalparameter, verordnete Arzneimittel, Laborbefunde, Gesundheitszustand (di- 
agnostiziert und selbstberichtet), patientenberichtete Endpunkte, Todesfälle und Todesursachen, 
Informationen über die eingebundenen Leistungserbringer, ggf. Daten aus klinischen Studien zu 
den eingeschlossenen Patienten. 

Die Verlinkungsinitiative SEER-Medicare verknüpft die von den Krebsregistern des SEER- 
Programms (Surveillance, Epidemiology, and End Results) erfassten Daten zu Inzidenz, Staging 
und Uberlebensraten von Krebserkrankungen mit den Abrechnungsdaten des Medicare- 
Programms (siehe oben). Die SEER-Register werden vom National Cancer Institute finanziert und 
stellen den umfassendsten bevölkerungsbasierten Datenbestand der Staaten in der Onkologie dar. 
Daten umfassen demographische Informationen, Tumor-bezogene Daten inklusive Identifizierung 
und Staging sowie versorgungsrelevante Abrechnungsdaten. Mögliche Forschungsfragen, die an- 
hand der verknüpften Daten beantwortet werden können, umfassen das Versorgungsgeschehen für 
Patienten vor und nach einer Krebsdiagnose (unmittelbar und mit Langzeitperspektive), die Nut- 
zung von Diagnostika und Prozeduren sowie die Kosten der Krebsversorgung. 

Auch im Bereich der Onkologie versteht sich CancerLinQ als eine „big data analytics platform“, 
die auf Basis von Daten aus der alltäglichen Versorgung von Krebspatienten die Versorgungsqua- 
lität verbessern möchte. CancerLinQ ist eine gemeinnützige Tochtergesellschaft der amerikani- 
schen Fachgesellschaft für klinische Onkologie (American Society of Clinical Oncology, ASCO) 
und wird somit von Onkologen geleitet; Kliniker, die die Datenbank abonnieren, können patien- 


tenbezogene Informationen aufrufen. Für Forschung stehen nur de-identifizierte Daten zur Verfü- 


gung, die je nach Projektantrag bereitgestellt werden. Von mehr als 100 teilnehmenden Praxen er- 
hebt CancerLinQ folgende Daten: Patienten und Praxeninformationen, Diagnosen, Pathologiebe- 
funde, Staging, Vitalparameter, klinische Bewertungen, Laborbefunde, Radiologiebefunde und 
Bildgebung, Behandlungspläne, verordnete und vor Ort dargereichte Medikamente, Radiothera- 
piebehandlungen, Operationen, weitere Outcomes sowie die Teilnahme an klinischen Studien. Es 
gibt darunter auch unstrukturierte Daten, die eine Kuration erfordern. CancerLinQ-Daten dürfen 


nicht mit anderen Datenbeständen verlinkt werden. 


Zusammenfassung und weitere Betrachtung einzelner Aspekte im Gutachten 
Die dargestellten Fallstudien lassen sich grob in fünf Kategorien einteilen: 


1) große administrative Datensätze, die es aufgrund der zentralen Zulaufstelle ermöglichen, Fragen 
über den Versorgungsprozess einzelner Patienten sektorenübergreifend abzubilden und Möglich- 
keiten zur Verlinkung mit anderen Daten aufweisen (z.B. MBS/PBS, NHIS/HIRA, ÖGIS, CMS); 

11) zentrale Stellen, die vorhandene Datenbestände unterschiedlicher Datenhalter und mit variablem 
Inhalt zusammenführen; hier zeichnen sich zwei Möglichkeiten aus: die Daten bleiben bei den Da- 
tenhaltern und werden auf Antrag verknüpft (z.B. PHRN, SDLE, eDRIS) oder in einer konsoli- 
dierten Datenbank aufgehoben (z.B. IDI); 

iii) Datenbestände, in denen routinemäßig erhobene Daten zusammengeführt und für Kliniker und 
Forscher zur Verfügung gestellt werden (z.B. CPRD, Nivel PC Database, SPIRE, Kaiser Health 
Connect); 

iv) elektronische Plattformen, die es (unter anderem) Patienten erlauben, Zugriff auf ihre eigenen 
Informationen zu gewinnen und die ggf. als potentielle Grundlage für klinische Daten für die For- 
schung betrachtet werden könnten (z.B. ELGA, myHR bzw. Sundhed.dk, Journalen); 

v) Tools, die die Forschung über mehrere Datensätze hinweg erleichtern (z.B. RKKP, Register- 
forsking). 

Die folgenden Kapitel des Gutachtens greifen selektiv auf einzelne Fallstudien zu, um wichtige As- 


pekte für eine Verbesserung der Situation in Deutschland hervorzuheben (Näheres siehe Kapitel 2). 
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Tabelle 3.1 Übersicht der Fallstudien und deren Inhalte (Datenkategorien korrespondieren zu den 


Blöcken in Abbildung 2.1) 


Mikrodaten 


Makrodaten 


Weitere 


Land 


Fallstudie 


Primäres Ziel 


SD | G |GV 


SD | G 


GV| U 


Australien 


PHRN 


Forschung — Ermöglichung der 
Zusammenführung von Daten 
aus ganz Australien 


V |v Y 


v 


v) 


* 


Y Y 


MyHR 


Versorgungskoordination, 
Patientenempowerment, Unter- 
stútzung von Forschung 


MBS/PBS 


Abrechnungsdaten werden fúr 
Forschung bereitgestellt um 
Steuerung im Gesundheitssys- 
tem zu ermóglichen 


Dánemark 


RKKP 


Verbesserung der klinischen 
Versorgung, sekundár Versor- 
gungsforschung 


Sundhed.dk 


Koordination von Leistungser- 
bringern, 
Patientenempowerment, Trans- 
parenz 


Finnland 


Findata 


Forschung: One-stop-shop für 
die Nutzung von sozialen und 
gesundheitlichen Sekundärdaten 


Kanada 


SDLE 


Ermöglichung der Forschung 
für das ganze Land ohne Bedarf 
an zusätzlicher Datenerhebung 


ICES 


Unterstützung der Versor- 
gungskontinuität, und For- 
schung für Gesundheitsplanung 


PopData BC 


Forschung über Gesundheitsde- 
terminanten, Wohlbefinden und 
Entwicklung 


Manitoba 
Population 
Research Data 
Repository 


Forschung zur Information von 
Entscheidungen in der Gesund- 
heits- und Sozialpolitik 


Neuseeland 


IDI 


Forschung zu multidimensio- 
nellen Fragen, Monitoring der 
Effektivität von Maßnahmen 
und Leistungen 
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Mikrodaten 


Makrodaten 


Weitere 


Land 


Fallstudie 


Primäres Ziel 


SD 


G 


GV 


SD 


G 


GV 


U 


Niederlande 


PHARMO 


Forschung — Nutzung von Real 
World Evidence, Innovations- 
förderung im Gesundheitswesen 


v 


v 


Nivel PC 
Database 


Forschung über Entwicklungen 
in Gesundheit und Inanspruch- 
nahme von Leistungen der Pri- 
märversorgung auf Basis von 
Routinedaten 


Österreich 


ELGA 


Versorgungskoordination: 
Unterstützung einer besseren 
Versorgung, wenn mehrere 
Leistungserbringer eingebunden 
sind 


ÖGIS/REGIS 


Gesundheitsmonitoring, 
-berichterstattung, und -planung 
(Steuerung im System) 


eRezept 


Vereinfachung von Verwal- 
tungsprozessen, Patientenem- 
powerment 


Schweden 


Register- 
forsking 


Unterstützung von Forschung 
durch die Bereitstellung von 
Informationen zu Registerdaten 
(Gesundheit, Steuer, Justiz, 
Bildung usw.) 


Journalen 


Patienteninformation und 
-empowerment, Versorgungs- 
qualität 


Südkorea 


NHIS/HIRA 


Bewertung und Verbesserung 
der Versorgungsqualität durch 
die Unterstützung von Gesund- 
heitssystemsteuerung auf Basis 
von Abrechnungsdaten 


UK 


CPRD 


Forschung über Primärversor- 
gung und Möglichkeit der Ver- 
linkung mit anderen Daten 


v) 


UK - 
Schottland 


eDRIS 


Forschung und Politikanalyse: 


Information über und Bereitstel- 
lung von (verlinkten) Daten 


SPIRE 


Forschung und Versor- 
gungsoptimierung durch die 
Zusammenführung von Daten 
aus der Primärversorgung 
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Mikrodaten 


Makrodaten 


Weitere 


Land 


Fallstudie 


Primäres Ziel 


SD | G |GV 


SD | G | GV 


U 


USA 


CancerLinQ 


Forschung — Zusammenfüh- 
rung von Beobachtungsdaten 
("real world cancer data") aus 
mehreren Quellen 


CMS Data 


Transparenz fiir Versorgungs- 
steuerung und 
-Forschung 


Kaiser Health 
Connect 


Verbesserung der klinischen 
Versorgung fiir individuelle 
Patienten, Forschung zur Ver- 
besserung der zukünftigen Ver- 
sorgung insgesamt 


PCORnet 


Forschung — zentrale Anlauf- 
stelle fiir weiter dezentral gehal- 
tene Daten von Leistungserbrin- 
gern, Krankenversicherern und 
sog. „patient-powered research 
networks“ 


SEER- 
Medicare 


Forschung über die Versorgung 
von Krebspatienten 


*Manche der regionalen Verlinkungseinheiten ziehen auch Umweltdaten heran 
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Kapitel 4: Erweiterte Möglichkeiten auf Basis von Routinedaten 


Für den Primärzweck integriert vorliegende Daten 
Drei der Fallstudien heben die Möglichkeit hervor, für Forschungsfragen auf vorhandene, integrierte 


Routinedaten zurückzugreifen. Damit sind Datensätze gemeint, welche bereits für den primären Nut- 
zungszweck in einer integrierten (verknüpften) Form über mehrere Leistungsbereiche erstellt werden. 
Ein aus Deutschland vergleichbares Beispiel sind dabei die Datensätze, welche den Krankenkassen auf 
Grundlage der Abrechnungsdaten vorliegen. Diese sind auf Versichertenebene, liegen über mehrere 
Jahre vor und decken verschiedene Leistungsbereiche ab; die Generierung dieser Datensätze erfolgt 
durch die jeweilige Krankenkasse und wird primär für Abrechnungszwecke bzw. interne Analysen der 
Krankenkassen genutzt. Abzugrenzen sind davon Datensätze, welche erst für Forschungszwecke (se- 
kundärer Nutzungszweck) erstellt bzw. verknüpft werden (diese werden im nächsten Abschnitt vorge- 
stellt). In Australien, Südkorea sowie den USA konnten Möglichkeiten der Datennutzung von inte- 
grierten Routinedaten identifiziert werden (vgl. Tabelle 4.1). Es handelt sich dabei in allen Ländern 
um Datensätze, welche sich überwiegend aus Abrechnungsdaten (Claimsdata) zusammensetzen; die 
tragenden Institutionen unterscheiden sich entsprechend der jeweiligen Gesundheitssystemstruktur. 

In Australien sind insbesondere die beiden großen Datensätze Medicare Benefit Schedule (MBS) und 
Pharmaceutical Benefit Schedule (PBS) zu nennen. In beiden Datensätzen sind Informationen zu allen 
erbrachten Leistungen enthalten, welche unter MBS bzw. PBS fallen. Da fast die gesamte australische 
Bevölkerung den Zugang zu gesundheitlicher Versorgung über MBS/PBS erhält, sowie ein Großteil 
der Leistungen vollständig oder anteilig abgedeckt sind, können die Datensätze als sehr umfangreich 
bzw. „vollständig“ betrachtet werden. Ein Vergleich mit primär erhobenen Daten hat gezeigt, dass die 
PBS-Abrechnungsdaten eine gute Alternative für die Erforschung des Versorgungsgeschehen darstel- 
len (Harris et al. 2017), obwohl sie tendenziell die Nutzung unterschätzen (Gisev et al. 2018). Zudem 
ist in beiden Datensätzen die Medicare-ID enthalten, welche eine Verlinkung zwischen beiden Datens- 
ätzen sowie auch zu anderen Daten ermöglicht (siehe dazu PHRN, weiter unten). Der Zugang zu den 
Daten ist für die Forschung klar reguliert und die Daten werden auch dementsprechend für wissen- 
schaftliche Analysen genutzt. 

In Südkorea fließen in die Datenbank der nationalen Versicherungsagentur alle Abrechnungsdaten für 
über 50 Millionen Versicherte (vgl. Kapitel 3). Diese Daten werden im Zuge der Vergütung von Leis- 
tungserbringern generiert: Abrechnungen werden elektronisch von Leistungserbringern an HIRA 
übermittelt, und werden dort geprüft. Die Abrechnungsdaten der erstatteten Claims landen im „Data 
Warehouse“ und werden dort für fünf Jahre gespeichert. Der Zugang für Forschungszwecke wurde im 
Jahr 2009 freigegeben. Entsprechend des Speicherungszeitraumes sind aktuell nur Projekte mit Daten 
der letzten 5 Jahre machbar, obwohl eine Erweiterung auf 10 Jahre angestrebt ist. Identifizierungszif- 
fern von Versicherten und Leistungserbringern werden verschlüsselt abgespeichert, um persönliche 
Informationen zu schützen. Da sich die HIRA-Daten auf Abrechnungsdaten (also Gesundheitsversor- 


gungdaten) beschränken, haben bisher einzelne Forschungsprojekte weitere Datenbestände (z.B. die 
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nationalen Gesundheitssurveys mit Gesundheitsdaten) herangezogen und mit verlinkten Daten gear- 
beitet. Das Linkage wurde dabei beispielsweise anhand regionaler Variablen oder basierend auf meh- 
reren Variablen, welche in beiden Datensätzen vorkamen (z.B. Geburtsdatum, Geschlecht etc.), vorge- 
nommen (vgl. Beispiele in Tabelle 4.1). Mikrodaten stehen Forschern in Universitäten und staatlichen 
Behörden zur Verfügung, bedingt und in engerem Umfang auch Interessenten von der Industrie und 
dem Privatsektor, also z.B. auch von privaten Versicherungsfirmen. Diese Zugänglichkeit für eigen- 
nütziges Interesse ist nicht ohne Kontroverse (vgl. z.B. Song 2017). Der Zugang zu den unbeschränk- 
ten Mikrodaten ist nach Vereinbarung und auf Basis eines Antrag- und Reviewprozesses über sieben 
Forschungszentren oder Fernzugang möglich. Darüber hinaus bietet HIRA auch bestimmte Stichpro- 
ben zur Krankenhausversorgung (13 % der Versicherten), zur älteren Bevölkerung (20 %) und der 
pädiatrischen Bevölkerung (10 %), die ohne Reviewprozess zugänglich sind (Kim et al. 2014). Aggre- 
gierte Daten sind als zusammenfassende Statistiken öffentlich zugänglich. 

Eine ähnliche Skalierung der Zugriffsmöglichkeiten ist auch bei den Routinedaten der öffentlichen 
Versicherungsprogramme in den USA zu finden (siehe Abbildung 4.1). Exemplarisch werden hier die 
Centers for Medicare and Medicaid Services (CMS) Daten von Medicare beschrieben (vgl. Kapitel 3 
zum Kontext im Gesundheitssystem). CMS erlaubt Forscher Zugang zu den Medicare- 
Abrechnungsdaten; diese umfassen Kontakte mit dem Gesundheitssystem, therapeutische Behandlun- 
gen inkl. Arzneimittel, Prozeduren, und weitere Leistungen. Eine Übersicht der mit Medicare-Daten 
durchgeführte Studien aus dem Zeitraum 1979-2016 zeigt eine wesentliche Zunahme der Nutzung, vor 
allem in den Jahren ab 2010 (im Jahr 2016 alleine 205 Publikationen; Mues et al. 2017). Die unter- 
suchten Fragestellungen umfassen die Erforschung von Muster von Morbidität, Mortalität und Krank- 
heitslast, die vergleichende Einschätzung des Effektes medikamentöser Therapien, die Abbildung der 
Kosten unterschiedlicher Versorgungspfade, die Analyse der Effekte des Verhaltens von Leistungser- 
bringern auf die Versorgung sowie des Einflusses von gesundheitspolitischen Maßnahmen auf Leis- 
tungserbringer und Patientenendpunkte. Somit ermöglichen diese Daten eine umfassende Einsicht in 
die Versorgung älterer Patienten. Um den Zugang zu den (richtigen) Daten zu ermöglichen und eine 
optimale Nutzung der vorhandenen Datenbestände zu unterstützen, kooperiert CMS mit dem Research 
Data Assistance Center (ResDAC), welches als Eingangstor und Wegweiser für Interessenten dient. 
ResDAC ist auch dafür zuständig, Anträge auf Wissenschaftlichkeit und Machbarkeit zu prüfen (vgl. 
dazu Kapitel 6). Trotz der großen Abdeckung der Bevölkerung über 65 Jahre im Medicare-Programm 
bilden die Medicare Daten nicht das gesamte Kollektiv der dazugehörigen Patienten ab; es gibt spezi- 
fische Versicherungsoptionen, die nicht eingeschlossen sind. Darüber hinaus sind diese Daten, ähnlich 
wie auch andere hier beschriebene Abrechnungsdaten dadurch limitiert, dass sie nur abgerechnete und 


somit erstattete Leistungen abbilden. 
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Tabelle 4.1 Umfang relevanter Datenbestände und Beispiele von darauf basierenden Studien 


Loa DE Was decken die Daten ab? Zugriff für Beispiele für veröffentlichte Ana- 
Forschung lysen 
Medicare Informationen zu allen Ja i) Beschreibung der Inanspruchnah- 
Benefit erbrachten Leistungen, die | Verknüpfung | me und der Kosten pádiatrischer 
Schedules vollständig oder anteilig mit anderen Versorgung und regionaler Ver- 
(MBS) unter den Medicare Benefit | Datenbestánden | gleich (Freed & Allen 2018) 
Schedule fallen, d.h. ein möglich ii) Zeitverlauf der Autismus- 
GroBteil der ambulanten Letztes verfiig- | Diagnosen nach Geschlecht (May & 
und stationären Versor- bares Daten- Williams 2018) 
gung. jahr: 2018 111) Inzidenz, regionale Variation und 
Von Medicare ausgenom- Versorgungstrends fiir keratinozyti- 
men sind z.B. zahnärztliche sche Neoplasien (Adelson et al. 
Australien Leistungen. 2018) 
Die Daten umfassen aktu- 
elle und Archiv-Daten. 
Pharmaceuti- | Informationen zu allen Ja i) Zunahme des Einsatzes von An- 
cal Benefit erbrachten Leistungen, die | Verknüpfung |tikoagulantien und der Kosten nach 
Schedule vollständig oder anteilig mit anderen Marktzugang neuer Medikamente 
(PBS) unter den Pharmaceutical |Datenbeständen | (Morgan et al. 2018) 
Benefit Schedule fallen. möglich 11) MBS und PBS Daten: Vorhersage 
Die Daten können über die | Letztes verfüg- | der Initiierung einer Zweitlinien- 
individuelle Medicare-ID _| bares Daten- therapie für Diabetes in der australi- 
auch mit den Daten des jahr: 2018 schen Bevölkerung (Fiorini et al. 
MBS verkniipft werden. 2019) 
National Behandlungen, verordnete | Ja i) Uberwachung des Einsatzes von 
Health Insur- | Arzneimittel, Prozeduren, |Verknüpfung | Antibiotika im Langschnitt (Park et 
ance (NHIS) |Diagnosen, Untersuchun- |mit anderen al. 2017) 
& NHIDB gen, soziodemographische | Datenbestánden | ii) Einfluss von Versicherungsschutz 
Charakteristika der Patien- |möglich (auf |auf Nutzung von Antikoagulantia 
ten Basis einzelner | (Ko et al. 2018) 

Südkorea Projekte) . 111) Umweltverschmutzung und 
Letztes verfiig- | Schwangerschaftshypertension (ver- 
bares Daten- linkte Daten, Choe et al. 2018; fiir 
jahr: 2018 den Aufbau der benutzten NHIS- 

Kohorte siehe Lee et al. 2017) 
iv) Verlinkung klinischer Register- 
daten (Schlaganfall) und HIRA- 
Daten (Kim et al. 2018) 
CMS Medi- | Kontakte mit dem Gesund- | Ja i) Unterschiede in Kosten zwischen 
care Data heitssystem, therapeutische | Verknüpfung | Universitäts- und anderen Kranken- 
Behandlungen inkl. Arz- mit anderen häusern (Burke et al. 2019) 
neimittel, Prozeduren, und | Datenbestánden | 11) Effekt einer jährlichen Vorsorge- 
weitere Leistungen möglich (z.B. | untersuchung auf Screeningraten, 

USA SEER-Medi- | Überweisungen, Inanspruchnahme 
care, individu- |und Kosten (Ganguli et al. 2019) 
elle Projekte) 


Letztes verfüg- 
bares Daten- 
jahr: 2017 
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l Public Use File (PUF) | l re | | en po 
ile 


Aggregierte Daten De-identifizierte Mikrodaten Mikrodaten 


Keine & D e es 


Keine Keine Gestaltbar 
[o] E AS 
0-2 Wochen 2-3 Wochen 3-5 Monate 


Abbildung 4.1 Úbersicht der CMS-Datenformate nach ResDAC (in Anlehnung an die ResDAC- 
Webseite) 


Zusammenführung von routinemäßig entstandenen Daten in einem neuen Datenbe- 


stand 
Es ist ersichtlich, dass eine gute Datengrundlage für Forschungszwecke vor allem dann vorliegt, wenn 


alle Informationen zur Interaktion von einzelnen Patienten mit dem Gesundheitssystem an einer zent- 
ralen Stelle gehalten werden; so können leistungserbringer- und ggf. sektorenübergreifende Versor- 
gungsprozesse abgebildet werden, im optimalen Fall auch im Zeitverlauf. Diese Bedingung ist grund- 
sätzlich in Gesundheitssystemen erfüllt, die ein „Gatekeeping“-System in der Primärversorgung ver- 
ankert haben; ein typisches Beispiel hierfür sind die Hausärzte (general practitioners, GPs) in Großbri- 
tannien. Kapitel 3 und die Länderprofile im Anhang bieten länderspezifisch Inforationen zum Thema 
Gatekeeping an. 

Unter den eingeschlossenen Fallstudien ist das typischste Beispiel für eine Datenbank, die von GPs 
erfassten Daten zusammenführt, der Clinical Practice Research Datalink (CPRD; zur Entstehungsge- 
schichte und Einbettung im britischen System vgl. auch Gothe 2015). CPRD führt Daten von Praxen 
zusammen, die sich in das Programm eingeschrieben haben (,,opt-in“). Patienten dieser Praxen können 
sich wiederum von der Datenübermittlung ausschließen lassen („opt-out“), im Einklang mit der natio- 
nalen opt-out Regelung des NHS (Vgl. Kapitel 8). Die von CPRD gehaltenen Daten können für Be- 
obachtungsstudien beantragt werden, oder zur Durchführung von experimentellen Studien unterstüt- 
zend herangezogen werden. Sie können darüber hinaus mit anderen Datensätzen von NHS Digital 
verknüpft werden, um reichere, sektorenübergreifende Einsichten zu ermöglichen (siehe auch nächsten 
Abschnitt, Kapitel 3 und Kapitel 5). Bereits mehr als 2000 wissenschaftliche Studien haben CPRD- 
Daten genutzt. 
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In Schottland wurde 2016 der Scottish Primary Care Information Resource (SPIRE) gegründet, um 
Daten aus schottischen Praxen zusammenzubringen und schottischen GPs die Möglichkeit zu geben, 
sich über ihr Patientenkollektiv im Vergleich zu informieren und Versorgung besser zu planen, sowie 
den schottischen NHS dabei zu unterstützen, die Qualität der Versorgung zu monitoren und zu verbes- 
sern. Auch hier können Patienten die Nutzung ihrer Daten von SPIRE ablehnen. Die Initiative betont, 
dass es bei SPIRE nicht um eine umfassende zentrale Datenbank aller Informationen zu schottischen 
Patienten geht, sondern um die zielspezifische Zusammenführung von Parametern aus GP-Daten für 
konkrete, bewilligte Zwecke. Daten werden nicht länger gespeichert, als es für die Bearbeitung der 
Anträge notwendig ist und Informationen werden danach vernichtet. Die vorliegenden Informationen 
zu SPIRE sind noch neu und nicht vollständig (vgl. SPIRE Rollout, SPIRE 2019). Es bietet sich aber 
an, den Aufbau der Initiative zu vergegenwártigen (vgl. Anhang 136) und in nächster Zeit erneut zu 
bewerten. 

Die Datenbank zur Primärversorgung des niederländischen Forschungsinstituts Nivel setzt ebenso 
Daten aus der Primärversorgung ein, allerdings kommen hier die Daten aus den elektronischen Praxis- 
verwaltungssystemen auch von Leistungserbringern jenseits der Hausärzte zusammen (vgl. Kapitel 3). 
In den Niederlanden wird dieses Modell auch von anderen Institutionen bzw. Initiativen genutzt (vgl. 
zum Beispiel Smeets et al. 2018). Allen Initiativen ist gemein, dass neben den Forschungsmöglichkei- 
ten die Daten auch explizit für Feedback an die teilnehmenden Praxen genutzt werden, inklusive einer 
Möglichkeit eigene Ergebnisse mit den von anderen Praxen zu vergleichen. Ein systematisches Re- 
view zu den Einflussfaktoren für die Entwicklung von Datenbanken auf Basis von elektronischen Pra- 
xisverwaltungssystemen in der Primärversorgung englischsprachiger Länder identifizierte weitere 
Initiativen in England, Kanada und den USA und fand, dass die wichtigsten Voraussetzungen für eine 
erfolgreiche Umsetzung eine robuste technische Infrastruktur sowie starke wissenschaftliche und poli- 
tische Unterstützung unabdingbar sind (Gentil et al. 2017). 

Das Zi-Praxispanel folgt einem ähnlichen Prinzip im deutschen Gesundheitssystem. Ärztliche Praxen 
sind aufgefordert, dem Panel zuzutreten. Ziele sind die Beobachtung von Qualität und Kosten, aber 
auch die Nutzung der Daten für die Versorgungsforschung. Der Aufbau der fachärztlichen Versorgung 
in Deutschland bedeutet, dass im Gegensatz zu den oben beschriebenen Beispielen auch Fachärzte im 


Praxispanel teilnehmen. 
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Tabelle 4.2 Zusammenführung von Daten in der Primärversorgung 


Land ehe Apdeckong | a ar 
Opt-out schung 
CPRD Ca. 650 Pra- |Patienten kön- | Zugriff ist für >2300 Artikel, 
xenin2016 |nen aus Data- Wissenschaftler, | https://www.cprd.com/bibliogr 
sharing ausstei- | Gesetzgeber/ aphy 
gen; GPs neh- |NHS-Beschäftigte |i) Änderungen in den Todesur- 
men freiwillig | und andere (inkl. |sachen von COPD-Patienten 
an der Übermitt- | Industrie) möglich | 2005-2015 (Gayle et al. 2019) 
UK lung an CPRD ii) Vergleichende Nutzenbe- 
teil. Ebenso ist wertung in der COPD- 
die Zustimmung Arzneimitteltherapie (Suissa et 
der Praxis fiir al. 2019) 
die Verlinkung iii) Internationaler Vergleich 
der Daten not- von ,,high-cost, high-need“- 
wendig Patienten (Tanke et al. 2019) 
SPIRE Rollout in Opt-in für Pra- |Ja, auf Antragsba- | Noch keine 
Umsetzung |xen; Patienten sis (geplant) 
UK können die 
Schottland Nutzung ihrer 
Daten aus- 
schließen 
Nivel PC |Repräsentati- |Opt-in für Pra- | Ja, auf Antragsba- | i) Nutzung von außerplanmäßi- 
Database |ve Stichprobe | xen; opt-out für | sis; Nivel eigene | ger Primärversorgung während 
von ca. 10% |Patienten Forschung der Pflegereform nach Ein- 
Niederlande der Bevölke- kommen (Jansen et al. 2018) 
rung 11) Nutzung von E-Mail- 
Beratung in der Primärversor- 
gung (Huygens et al. 2018) 


Verlinkung von unabhängig entstandenen Datenbeständen 


In der Recherche wurden mehrere Fallstudien identifiziert, in denen verschiedene Datenquellen mit 
unterschiedlichem Inhalt über eine oder mehrere Verlinkungsvariablen verknüpft werden. Dies bedeu- 
tet im Gegenzug zu den in den vorigen Abschnitten des Kapitels beschriebenen Datenbeständen, dass 
die Daten nicht bereits für den primären Nutzungszweck integriert erhoben werden oder zu einem 
neuen Datenbestand zusammengeführt werden, sondern erst für den sekundären Nutzungszweck (in 
diesem Fall für die Forschung) verknüpft werden müssen. Dies kann entweder notwendig sein, da die 
Daten für den primären Zweck nur einen sehr abgegrenzten Bereich abdecken (für Deutschland wären 
hier u.a. die $21er KHEntgG Daten ein Beispiel) oder da noch eine zusätzliche Erweiterung eines be- 
reits umfangreichen Datensatzes notwendig ist, um Forschungsfragestellungen entsprechend zu be- 
antworten (bspw. eine Verknüpfung von Daten der gesundheitlichen Versorgung mit Daten zur Be- 
rufstätigkeit/Arbeitslosigkeit oder von klinischen Daten mit Abrechnungsdaten). 

Das übergreifende Ziel der hierunter fallenden Initiativen ist es, einen besseren Datenzugang für die 
Forschung zu ermöglichen. Dabei werden Daten aus verschiedenen Quellen, insbesondere von ver- 


schiedenen öffentlichen Institutionen verlinkt. So können bspw. Daten zur gesundheitlichen Versor- 
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gung mit Daten aus dem Bildungsbereich und Kriminalitätsstatistiken verknüpft werden. Die Mög- 
lichkeit des Datenzugriffs ist bei fast allen Initiativen über Antragsverfahren geregelt (siehe Tabelle 
4.3). Einen Überblick über die durchgeführte Forschung auf Basis der Daten bzw. über alle positiv 
evaluierten Anträge wird ebenso von fast allen Initiativen auf der entsprechenden Homepage gegeben, 
so dass eine hohe Transparenz erzielt wird und auch für die breite Öffentlichkeit ersichtlich ist, wie die 
Daten genutzt werden. 

Sowohl die entsprechenden Informationen in Kapitel 3 (Tabelle 3.1) sowie die in Tabelle 4.3 aufge- 
führten Beispiele heben die Möglichkeiten klar hervor, die sich auf Basis solcher zentralen Stellen für 
die Zusammenführung unabhängig entstandener Datensätze für die Versorgungsforschung eröffnen. 
Hier nicht näher beleuchtet, aber im Prinzip ähnliche Überlegungen gestützt, sind auch Fallstudien wie 
eDRIS in Schottland oder PHARMO in den Niederlanden, sowie die neue Behörde Findata Authority 
in Finnland. Unterschiedlich unter den hier aufgeführten Fallstudien — und relevant im Hinblick auf 
die Überlegungen für eine potenzielle Ideengewinnung für den deutschen Raum - ist das Ausmaß der 
Konsolidierung der unterschiedlichen Datenbestände. So knüpfen zum Beispiel das PHRN und das 
SDLE die Daten Projektspezifisch zusammen, während die Quelldatensätze grundsätzlich verteilt 
bleiben. Im Gegensatz hinzu fügt die „integrierte“ IDI eingegangene Daten mithilfe eines „Spine“ 
zusammen (Vgl. Kapitel 5). Interessant im Ansatz des PHRN ist auch, dass die regionalen Behörden 
auf Bundesstaatsebene eigene Verlinkungsstellen haben, die im Netzwerk des PHRN kooperieren, die 
aber auch eigene Verlinkungen durchführen. Dieser Gedanke könnte auch für das deutsche Gesund- 
heitssystem in Erwägung gezogen werden, vielleicht in Kombination mit einer Ausgestaltung des 


German Record Linkage Center. 
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Tabelle 4.3 Modelle mit einer zentralen Stelle, die verteilte Datensätze (unterschiedlicher Daten- 
halter) verknüpft 


| Was wird verlinktund | Ye führt | 7 ugrifrfür | Beispiel für veröf- 
Land Fallstudie f o das Linkage fentlichte Analy- 
wo liegen die Daten? Forschung 
durch? sen 
Population Routinemäßig verknüpft | In Abhán- Zugriff für Überblick über 
Health Re- werden Daten aus: Ge- gigkeit von die For- einzelne Studien: 
search Net- | burtenregister, Perinatale | den ange- schung ist https://www.phrn.or 
work Daten (Schwangerschaft, | fragten Da- klar reguliert | g.au/for-the-com- 
(PHRN) Geburt etc.), Sterberegis- | tensätzen und | und läuft munity/case-stu- 
ter, Krebsregister, Men- | der zu- über ein dies/ 
tal Health, öffentliche ständigen Antragsver- Beispiele: 
Notaufnahmen (Public Region (Ju- fahren. Zu- 1) Suizidrisiko nach 
Emergency Depart- risdiction) dem fallen Inhaftierung in 
ments), private und öf- gibt es eine Gebühren für | Queensland (Spittal 
Aüstralien fentliche Kran- verantwortli- | die Verknüp- | etal. 2016) 
kenhausfälle. Es können | che Data- fung bzw. ii) Verbesserung 
auch Daten zusätzlich Linkage Unit | Datennut- der Schätzung von 
verknüpft werden, dabei | (DLU). Die zung an. Mortalitätsratios in 
gibt es Unterschiede DLUs sind Krankenhäusern 
nach verantwortlicher alle Teil des (Spilsbury et al. 
Region (Jurisdiction). PHRN. 2017) 
Die Daten sind bei den 
entsprechenden Instituti- 
onen angesiedelt. 
Social data Zur Verfügung stehen Statistics Ja, Zugang Übersicht positiv 
linkage Daten aus der Arbeits- Canada zu manchen | evaluierter Anträge: 
environment | kräfteerhebung, natio- verknüpften | https://www.statcan 
(SDLE) nalen Gesundheitsbefra- Daten bzw. .gc.ca/eng/record/2 
gungen, Kranken- zur Daten- 018 
hausentlassungen, Zen- verknüpfung 
sus-Daten, umweltbezo- kann bean- 
gene Makrodaten und tragt werden. 
eine Reihe von Provinz- 
Kanada daten über Kriminalität, 


Bildung, psychische 
Gesundheit usw. 

Die Daten sind in einer 
gesicherten Umgebung 
von Statistics Canada 
gespeichert; es gibt eine 
Trennung des DRD, der 
Source Data files und des 
Key Registry (vgl. Kap 
3). 
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Wer führt 


Beispiel für veröf- 


Land Fallstudie 2 vs ve u ud das Linkage ann fentlichte Analy- 
wo liegen die Daten? Forschung 
durch? sen 
ICES linked | Daten aus verschiedenen | ICES Der Zugang | Übersicht Publika- 
data administrativen Quellen, ist für For- tionen: 
Surveydaten sowie Re- scher außer- | https://www.ices.on 
gisterdaten werden ver- halb des .ca/Publications/Jou 
knüpft. Es ist aus- IC/ES seit rnal-Articles 
schließlich die Bevölke- 2009 mög- Beispiel: 
Kanada — rung aus Ontario in den lich und setzt | i) Luftverschmut- 
Ontario Daten abgebildet. Die einen erfolg- | zung und Risiko für 
Daten sind auf den Ser- reichen An- Vorhofflimmern 
vern von IC/ES in einem trag voraus. und Schlaganfall 
geschlossenen Compu- (Shin et al. 2019) 
ting-System gehalten. 
Population Daten auf Individual- PopData BC | Ja, Zugang Liste Forschungs- 
Data BC ebene, de-identifiziert ist für die projekte: 
(PopData und im Längsschnitt zur Forschung https://www.popdat 
BC) Bevölkerung von British geregelt. Es a.bc.ca/ria/projects 
Columbia. Daten kom- gibt ein An- | Beispiel: 
men von verschiedenen trags-system. | 1) Neugeborenen- 
„Partnern“ (u.a. Krebs- Outcomes bei Vä- 
registern, Gesundheits- tern unter Medika- 
Kanada - ministerium, Statistics tion für Multiple 
British Canada). Es können Sklerose (Lu et al. 
Columbia eigene Datensätze der 2014) 
beantragenden Forscher 
auch verknüpft werden. 
Daten sind auf dem zent- 
ralen Server („Secure 
Research Environment“) 
gespeichert. 
Manitoba Administrative, survey, Manitoba Ja, Zugang Beispiele: 
Population register- und weitere Population ist für die i) Autismus-Risiko 
Research Daten, werden für die Research Forschung bei pränataler Anti- 
Data Repos- | Einwohner von Manitoba | Data Repos- | geregelt. Es biotikaexposition 
itory verlinkt. Daten kommen | itory gibt ein An- | (Hamad et al. 2019) 
von verschiedenen Orga- trags-system. | ii) Zusammenhang 
nisationen. zwischen den sozi- 
Kanada — . : 
B Daten sind auf den Ser- alen Determinanten 
Manitoba 


vern des Manitoba Cen- 
ter for Health Policy 
gespeichert. 


von Gesundheit und 
Versorgungsqualität 
(Katz et al. 2018) 
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Was wird verlinkt und 


Wer führt 


Zugriff für 


Beispiel für veröf- 


Land Fallstudie wo liegen die Daten? das Linkage Fo scuone fentlichte Analy- 
durch? sen 
Integrated Beinhaltet Mikrodaten Stats NZ Ja, Zugang Übersicht aller 
data infra- der Einwohner und ist für die Forschungspro- 
structure Haushalte in Neuseeland. Forschung jekte: 
(IDI) Die Daten sind im geregelt. Es https://cdm20045.c 
Längsschnitt und de- gibt ein An- | onten- 
identifiziert. Die Daten trags-system. | tdm.oclc.org/digital 
kommen von verschiede- /collection/p20045c 
nen Ministerien, Befra- olll7 
gungen sowie von Nicht- Beispiele: 
Regierungs-Organisatio- 1) Zusammenhang 
nen. Die Daten decken zwischen Ruralität, 
Neuseeland ein sehr breites Feld ab, Freilandexposition 


u.a. den Gesundheitsbe- 
reich, Bildungsbereich 
und Polizeistatistiken. 
Daten sind auf den Ser- 
vern der IDI gespeichert 
(>166 Milliarden Be- 
obachtungen) 


und Aufmerksam- 
keits-Defizit-Hy- 
peraktivitäts-Stö- 
rung (Donovan et 
al., fortl.) 

11) Finanzielle Be- 
lastung durch Ver- 
letzungen für ältere 
Arbeitnehmer 
(Davie & Lilley 
2018) 
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Kapitel 5: Unterschiede im Verlinkungsprozess 


Kapitel 4 hat das Potential der Verlinkung von Datenbeständen im Gesundheitswesen grundsätzlich 
beleuchtet. Dabei kann es sowohl um eine Verlinkung bestehender Datensätze gehen, als auch um das 
Zuspielen neuer Ergebnisse aus der Primärforschung auf vorhandene administrative Daten (oder um- 
gekehrt). Eine erfolgreiche Verlinkung setzt die Möglichkeit einer eineindeutigen Zuordnung von 
Informationen aus separaten Datensätzen voraus. Dazu sind geeignete Schlüsselvariablen notwendig, 
die in allen zu verlinkenden Datensätzen vorhanden sind. Für eine personenbezogene Verlinkung ist es 
aus datenschutzrechtlichen Gründen häufig notwendig, statt eindeutiger personenidentifizierender 
Merkmale aus den Originaldaten, wie eine Versicherungs- oder Ausweisnummer, Pseudonyme einzu- 
setzen; dabei muss für alle zu verlinkenden Datenquellen dasselbe Pseudonymisierungsverfahren an- 
gewendet werden. Die Zuständigkeiten für die Pseudonymisierung der Daten sowie der Prozess der 
De-Identifikation der Datenbestände können auch erheblich zur Bewahrung der Anonymität und zum 
Schutz der Privatsphäre beitragen. In Deutschland war es bisher datenschutztechnisch herausfordernd, 
einen breiten Einsatz der Verlinkung von gesundheitsbezogenen Daten zu etablieren. Nichtsdestotrotz 
zeigen erfolgreiche Fallbeispiele, dass die entsprechenden Möglichkeiten besser ausgenutzt werden 
können (vgl. March, Stallmann & Swart 2015). Mit der „Guten Praxis Datenlinkage“ wurden methodi- 
sche Standards zur Verlinkung personenbezogener Daten im Rahmen von Forschungsvorhaben formu- 
liert (March et al. 2019). 

Die detaillierte technische Beschreibung möglicher De-Identifikations- und Verlinkungsoptionen geht 
über den Rahmen dieses Gutachtens hinaus. Nichtsdestotrotz erscheint es sinnvoll, beispielhaft verein- 
zelte Ansätze zu beleuchten, um erste Ideen für zukünftige Diskussionen zu erlauben. So gibt es in der 
Stichprobe der hier erhobenen Fallstudien ein Cluster, welches ein Verfahren basierend auf einer zu- 
erundeliegenden, ,,verankernden“ Liste von Personen nutzt, um mittels identifizierender Merkmale 
diese Personen in den zu verlinkenden Datensätzen zu identifizieren und Daten somit zu verknüpfen. 
In der neuseeländischen IDI ist das der „IDI Spine“. Dieser stellt eine Liste von Individuen dar, die 
Informationen der Finanzämter mit Geburten- und Visum-Angaben kombiniert. Ziel des Spines ist es, 
alle möglichen Individuen zu identifizieren, die jemals in Neuseeland gewohnt haben (Zielpopulation), 
und ein einziges Mal zu erfassen (Black 2016; Statistics NZ 2014). Die Mikrodaten von den in der IDI 
abgebildeten Sektoren sind dann mit dem Spine verknüpft und können somit auch miteinander verlinkt 
werden, auch ohne ein eineindeutiges identifizierendes Merkmal über die unterschiedlichen Sektoren 
hinweg. Ähnlich funktioniert das „Population Spine“ in Schottland, welches für die Verlinkungen über 
eDRIS herangezogen wird. Es bildet alle Personen in Schottland ab, die in Kontakt mit NHS Scotland 
waren, samt ihrer Identifikatoren (ISD Scotland 2019b). Abbildung 5.1 zeigt den Prozess in Schott- 
land, der damit beginnt, nur die Identifikatoren in den Datensätzen eingeschlossener Personen mit dem 


Spine zu matchen. 
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Index Team verlinkt 
Personenidentifikatoren über 


Datenliefernde Einrichtung A 


De problistisches Matching mit 


dem Spine und erstellt 
anonymisierte Identifikatoren 


Personenidentifikatoren an das 
Index Team 


u 


u 


eDris Team verlinkt die Daten 
und stellt diese zu 
=> Forschungszwecken in einer 
sicheren Umgebung zur 
Verfügung 


> 


l Ablauf wird für jeden an der Studie teilnehmenden datenliefernde Einrichtung wiederholt ) 


Abbildung 5.1 Verlinkungsansatz in Schottland (eDRIS) 


Das gleiche Konzept einer Liste der Zielpopulation mit Identifikationen liegt auch dem Derived Re- 
cord Depository (DRD) in Kanada zugrunde, welches für die Verlinkungen über das SDLE eingesetzt 
wird. Das DRD kann über seine Quelldaten aktualisiert werden. Neben dem DRD gibt es beim SDLE 
auch das „key registry“, wo dann die verknüpften IDs der verschiedenen Datensätze abgekoppelt ge- 
speichert werden, so dass dann über das key registry später die entsprechenden Fälle in den ursprüng- 
lichen Datensätzen identifiziert werden können (Trudeau 2017). Datensätze, die denselben eineindeu- 
tigen Identifikator („unique person identifier“) enthalten, können darüber verknüpft werden; dies kann 
zum Beispiel für Datenbestände aus dem Gesundheitsbereich erfolgen, die die „Health Insurance 
Number“ enthalten. Sonst werden deterministische und probabilistische Ansätze eingesetzt, um die 
Datensätze anhand von nicht-eineindeutigen Identifikatoren zu matchen. Das Prinzip der Trennung 
zwischen den Daten mit den Informationen zur Verknüpfung und den ursprünglichen Daten, sowie 
auch ein „population repository”, werden auch bei PopData BC angewendet. Es entsteht ein Datensatz 
mit den Verknüpfungsinformationen, über diesen können dann Fälle aus anderen Datensätzen identifi- 
ziert werden. 

Der Ansatz zur Verlinkung von Daten mit sensiblen Variablen für das Manitoba Population Research 
Data Repository wird hier hervorgehoben, da die Grundidee zur Diskussion über die Rollenverteilung 
bei der De-Identifizierung von Datenbeständen beitragen könnte. Die Datensätze kommen beim Repo- 
sitory ohne identifizierende Merkmale wie Namen, Adressen und Telefonnummern an. Diese schicken 
Datenhalter getrennt an Manitoba Health (das Landesgesundheitsministerium von Manitoba), während 
sie an Manitoba Centre for Health Policy (MCHP, dem Host des Repository) nur Programmdaten und 
Referenznummern schicken. Somit haben weder Manitoba Health noch MCHP Zugang zum vollstän- 
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digen Datensatz. Manitoba Health verlinkt unter Benutzung deterministischer und probabilistischer 
Methoden die identifizierenden Merkmale mit persönlichen Gesundheitsinformations-ziffern (personal 
health information number, PHIN); letztere werden dann verschlüsselt zusammen mit den Referenz- 
nummern als „crosswalk files“ an MCHP geschickt. Jede Person, die in Manitoba gesetzlich versichert 
ist (vgl. Kapitel 3), sowie jede Person, für die eine Leistung in Manitoba abgerechnet wurde, bekommt 
eine eigene PHIN. Sobald MCHP diese Informationen hat, kann es anhand der Referenznummern die 
Programmdaten mit den verschlüsselten PHINs verknüpfen. Das zugrundeliegende Prinzip ist, dass 
keiner der drei betroffenen Akteure alle Informationen hat: die Datenhalter haben keinen Zugriff auf 
die verschlüsselten PHINs, das Repository hat keinen Zugriff auf die identifizierenden Merkmale und 
Manitoba Health hat die Programmdaten nicht (vgl. Abbildung 5.2). 


Datenliefernde Stelle 


(nicht gesundheitsbezogene Daten) 
O Identifizierende Informationen 


(z.B. Name, Adresse,...) 


1001000111001 


C] Interne Referenznummer # 
(verschlüsselte Fallnummern) 


LJ Programmdaten 


D Verschlüsselte PHIN 


Manitoba Health MCHP 

Ordnet reale PHIN zu, löscht Daten werden separat gespeichert und 
identifizierende Informationen, können nur für genehmigte 
verschlüsselt PHIN Forschungszwecke verlinkt werden 


Übermittlung der Überleitungsdaten an 
MCHP 


Abbildung 5.2 Verlinkungsansatz in Manitoba 


Ein interessantes Beispiel liefert darüber hinaus die Verlinkung der Daten für den CPRD und der 
CPRD-Daten mit anderen Datenbeständen (vgl. Kapitel 3 und 4). Bevor Daten aus den Praxen in den 
CPRD fließen, werden identifizierende Merkmale (Namen, Geburtsdaten, Postleitzahlen und National 
Health Service Numbers) über die Praxissoftwareanbieter entfernt und mit pseudonymisierten Patien- 


ten- und Leistungserbringeridentifikatoren ersetzt. Für Praxen, die der Datenverlinkung zugestimmt 
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haben, schicken die Softwareanbieter die Identifikatoren an NHS Digital, welches die Validität der 
Daten überprüft und diese mit vorhandenen Daten aus der CPRD zusammenführt, um eine „Kohorte“ 
zu bilden. Datenhalter der zu verlinkenden Datensätze (vgl. Box 3.2) schicken identifizierende Merk- 
male ebenso an NHS Digital zusammen mit einem pseudonymisierten Patientenidentifikator, den 
„Link ID“. NHS Digital matcht die Identifikatoren der externen Datenhalter zu den CPRD- 
Identifikatoren und generiert eine „Linker“-Datei mit Paaren von pseudonymisierten Identifikatoren 
(Praxis und Patienten-ID, Link ID) für jeden Patienten (Padmanabhan 2019). 

Die Verlinkungsinitiativen in den Ländern zeigen, dass auch ohne das Vorhandensein eines eindeuti- 
gen Identifikators eine Verknüpfung auf Basis anderer identifizierender Merkmale möglich ist und seit 
mehreren Jahren erfolgreich eingesetzt wird. Tabelle 5.1 hebt dies beispielhaft hervor. Darüber hinaus 
sind die Verteilungen der Zuständigkeiten variabel — nichtsdestotrotz kann man beobachten, dass der 


Einsatz von Vertrauensstellen unterschiedlicher Zugehörigkeiten als üblich gilt. 


Tabelle 5.1 Übersicht über genutzte Verlinkungsmethoden nach Initiativen 


Land Initiativen Typ und Vorgang der Verlinkung 
PHRN Probabilistische Verlinkung ohne eineindeutigen Identifikator 
Ain auf Basis anderer identifizierender Merkmale (Vorname, Nach- 
een name, Geburtsdatum, Adresse). 
PHRN unterstützt die entsprechenden lokalen (state, territory) 
Institutionen bei Datenverknüpfungen. 
SDLE StatCan verlinkt auf sicherem Server; deterministisch oder pro- 
babilistisch basierend auf Vorhandensein von identifizierenden 
Informationen der zu verknüpfenden Datensätze. 
Kanada - 7 Dr: ] 
Manitoba Population Research |Personal Health Number; De-Identifizierung und Verlinkung der 
Data Repository Daten wird von derselben Einheit des Ministeriums durchge- 
führt. 
Integrated Data Infrastructure Innerhalb der Sektoren ggf. eindeutige Identifikatoren. Alterna- 
Neuseeland | (IDI) tiv probabilistische Verknüpfung, basierend auf vorhandene 
Personendaten im Spine. Die Verlinkung wird von Stats NZ 
durchgeführt. 
UK Clinical Practice Research Data- |NHS Number und andere Personen- und Praxisbezogene Daten; 
link (CPRD) deterministisches Vorgehen 
UK electronic Data Research and Community Health Index und andere identifizierende Merk- 
Schottland | Innovation Service (eDRIS) male, probabilistisches matchen über Spine. 
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Kapitel 6: Zugriff auf gesundheitsrelevante Daten für Forschende 


Neben den eingeschränkten Auswertungsmöglichkeiten der zur Verfügung stehenden Daten im deut- 
schen Gesundheitswesen (vgl. Kapitel 1) wird auch der Datenzugang als herausfordernd bzw. nicht 
optimal kritisiert. Insbesondere für Projekte, die eine Verlinkung unterschiedlicher Datenbestände 
benötigen, sind die Berechtigungen intransparent und die Antragsverfahren häufig kompliziert und 
langwierig. Somit können die Projektdurchführung und somit ggf. auch die Relevanz von gewonnenen 
Einsichten erheblich erschwert werden. Aber auch die konkreten Möglichkeiten für einen Zugriff auf 
erfolgreich beantragten Daten schöpfen das Spektrum der zur Verfügung stehenden Mechanismen 
nicht aus. 

Für alle relevanten in der Stichprobe enthaltenen Fallstudien ist eine Beantragung der Datennutzung 
bei der zuständigen Institution notwendig. Dies verläuft in vielen Fällen digital und wird für viele der 
geschilderten Fallstudien von einer zentralen Stelle unterstützt, auch wenn mehrere Datenhalter einge- 
bunden werden müssen (z.B. PHRN, eDRIS). Zum Beispiel zählt der Vorgang der Antragstellung bei 
PopData BC zu den zugänglichsten und transparentesten in Kanada und verläuft in drei Schritten: der 
Antrag muss inklusive Ethik- und Reviewprozesse sowie Einwilligungsdokumente eingereicht wer- 
den; die zuständigen PopDataBC-Mitarbeiter helfen die Antragsteller, die Genehmigung der notwen- 
digen Datenhalter zu bekommen; nach erfolgreichen Genehmigungen können Nutzungsverträge (in- 
klusive Kosten) und Geheimhaltungsvereinbarungen unterschrieben werden. Schlussendlich müssen 
erfolgreiche Antragsteller ein Datenschutztraining absolvieren und ihre Arbeitsumgebung innerhalb 
der gesicherten Forschungsumgebung von PopData BC einrichten. Für alle Fallstudien, die einen Zu- 
gang für Forscher vorsehen, waren die Beantragungsregelugen entweder explizit auf der Webseite 
beschrieben oder es wurde auf die entsprechende Stelle verwiesen. 

Da Daten im Gesundheitssystem grundsätzlich sensibel sind, kommen in der Regel drei Zugangswege 
in Frage: (1) eine direkte Datenübermittlung, die ein angemessenes Datenschutz- und Datensiche- 
rungskonzept voraussetzt; (2) die Inhouse-Auswertung, die an geeigneten Gastarbeitsplätzen der da- 
tenhaltenden Institution stattfindet; und (3) die Fernabfrage, die auf separaten Servern mit „remote 
access“ über VPN-Verbindung möglich ist (vgl. Ihle et al. 2015). Wie Tabelle 6.1 zu entnehmen ist, 
kommen alle drei Zugangswege in der Stichprobe der eingeschlossenen Fallstudien vor. Der bisher 
eingesetzte Ansatz für die Bearbeitung der DaTraV-Daten in Deutschland (vgl. Kapitel 1) wurde so in 
keinem anderen Land identifiziert. Hingegen scheinen sowohl die Nutzung von Gastarbeitsplätzen als 
auch die Fernabfrage über VPN zunehmend Anwendung zu finden. 

Ein interessantes Beispiel zur Vergegenwärtigung der Beantragungs- und Nutzungsprozesse bietet das 
Secure Unified Research Environment (SURE), welches für die Nutzung der PHRN-verlinkten Daten 
in Australien zum Einsatz kommt (Abbildung 6.1). Es wird vom Sax Institute in Sydney gemanagt und 
stellt eine Datenverarbeitungsumgebung dar. Hier können Datenverwalter und Forscher Daten hochla- 


den und Forscher Daten analysieren. Es wird in der Regel zur Bearbeitung von de-identifizierten 
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Mikrodaten und verlinkten Daten benutzt. Während der Bearbeitung bleiben die Daten auf den Sax- 


Servern in Sydney, nach erfolgreichem Abschluss der Analyse können aber aggregierte Daten auf 


lokale Computer heruntergeladen werden und gehören den Forschern. Autorisierte Nutzer von SURE 


können überall in der Welt arbeiten und die Umgebung mittels sicheren Einloggens betreten. 


Tabelle 6.1 Prozesse für den Datenzugriff für ausgewählte Fallstudien 


Woron Wie lang Wie bzw. Wo Wen se 
Wer kann die er = Wer ent- dauert der können For- Be ae 
Fallstudie Daten bean- en scheidet über | Bewer- scher mit den tae d 
tragen? Anträge? tungspro- Daten arbei- 
beantragt der Analy- 
zess? ten? 
werden? se? 
Forscher, deren |PHRN Data linkage | Variiert SURE, remote- | Data bleibt 
PHRN Projekte inhalt- | Online unit entspr. der access data auf den 
. liche und ethi- Application zu verlin- research labora- | Servern in 
(Australien) : 
sche Vorschrif- | System kenden Da- |tory Sydney 
ten erfüllen tenbestände 
Kanadische PopData's | Datenhalter Variiert ent- | Secure Research | Datenhalter 
Forscher diean |Data sprechend Environment 
einer For- Access Unit der Rück- (SRE), kann 
PopData BC |schungs- (DAU) meldungen über einen Fire- 
(Kanada) institution ar- von Daten- wall mittels ver- 
beiten hältern schlüsseltem 
VPN benutzt 
werden 
Forscher, die Nivel über |Nivel auf Durchschn. |Jenach Antrag, | Nivel 
bestimmte ein Formu- |Basis der 3 Wochen, entweder Fern- 
Vorschriften lar (auf Verfahrens- aber abhän- |zugang- 
Nivel PC erfüllen (inkl. Webseite | ordnung (Spit- | gig von Einrichtung 
Database Verpflichtung verfügbar) |zenverbände [Komplexität | („remote access 
(Niederlande) |2"" Veröf- der Leistungs- | und Daten- facility“) oder 
fentlichung der erbringer und | schutzbe- Datensatz direkt 
Ergebnisse) Datenschutz- |sonderheiten |erháltlich 
komitee) 
Analysten und Statistics Statistics NZ, |Review- Statistics NZ Statistics 
Forscher im NZ + ggf. andere | prozess: 6 secure data lab | NZ 
öffentlichen (online) Behörden Wochen environment 
IDI Sektor, Univer- (bei den Nieder- 
(Neuedand) sitäten und lassungen von 
NGOs StatsNZ; eigene 
data labs können 
beantragt wer- 
den) 
Wissen- HIRA HIRA 2-4 Wochen | Sieben For- HIRA 
schaftler, öf- nach Antrag |schungszentren 
HIRA fentlicher Sek- bis Daten oder Fernabfra- 
(Südkorea) tor, Privatsektor vorhanden ge (unter Aufla- 
(Umfang der sind gen) 


Daten variiert) 
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Abbildung 6.1 Beantragung und Nutzung von Daten über SURE (Sax Institute 2019) 
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Kapitel 7: Überlegungen zu elektronischen Patientenakten 


Daten aus elektronischen Patienten- bzw.- Gesundheitsakten bieten eine weitere Quelle für Analysen 
für die Versorgungsforschung. Einleitend müssen die Begrifflichkeiten jedoch auseinandergezogen 
werden. Die US-Amerikanische Behörde für Gesundheits-IT differenziert zwischen elektronischen 
Krankenakten („electronic medical record“), elektronischen Gesundheitsakten („electronic health re- 
cord“) und elektronischen Patientenakten („personal health record“; vgl. Box 7.1 und zum Inhalt von 
elektronischen Gesundheitsakten auch Häyrinen et al. 2008). Während nach dieser Aufteilung die 
elektronische Krankenakte der Patientenakte im elektronischen Praxisverwaltungssystem einzelnen 
Leistungserbringer entsprechen würde, unterscheidet man hierzulande zwischen den als Satzungsleis- 
tung nach $ f 68 SGB V von einzelnen Krankenkassen angebotenen elektronischen Gesundheitsakten, 
welche unterschiedliche Funktionalitäten und Möglichkeiten der ärztlichen Einbindung umfassen und 
der in $ 29la SGB V geregelte elektronische Patientenakte, die einheitliche Möglichkeiten für alle 
Versicherte anbieten soll und das zentrale Element der vernetzten Gesundheitsversorgung und der 


Telematikinfrastruktur darstellt (KBV 2019). 


Box 7.1 Begriffsbestimmungen nach der US-Amerikanischen Behörde für Gesundheits-IT 


Elektronische Krankenakte („electronic medical record“): vereinfacht eine digitale Version der traditionell 
papierbasierten Krankenakte; primärer Zweck: Diagnose und Behandlung bei Klinikern in derselben Organi- 
sation (Praxis, Krankenhaus). Nicht für den Austausch mit weiteren Leistungserbringern gedacht. 


Elektronische Gesundheitsakte (‚electronic health record“): breiterer Einsatz, enthält Informationen von allen 
Leistungserbringern, die in der Versorgung der Patienten beteiligt sind und alle diese Leistungserbringer dür- 
fen auf die darin enthaltenen Informationen zugreifen. Elektronische Gesundheitsakten „folgen den Patien- 


cc 


ten”. 


Elektronische Patientenakte („personal health record“): sie enthalten die gleichen Informationen wie elektroni- 
sche Gesundheitsakten, sind aber so aufgebaut, dass sie von Patienten abgerufen und gemanagt werden kön- 
nen. Ziel ist, dass Patienten ihre Informationen in einer privaten, gesicherten und vertraulichen Umgebung 
aufbewahren und verwalten können. 


Quelle: Office of the National Coordinator for Health Information Technology 2019 


Tatsächlich sind elektronische Patientenakten, bzw. Anwendungen, die es Patienten und Leistungser- 
bringern erlauben, alle gesundheitsbezogenen Informationen zusammenhängend aufzurufen, in vielen 
Ländern ein zentrales Element der Umsetzung von e-Health. Dänemark ist in der Länderstichprobe 
hierfür das beste Beispiel. Über das zugrunde liegende Netzwerk für Gesundheitsdaten, welches Ge- 
sundheits- und Gesundheitsversorgungsinformationen von allen Leistungserbringern enthält (vgl. Ab- 
bildung 3.1), können Patienten ihre Daten auf Sundhed.dk aufrufen. Schweden hat ein im Prinzip ähn- 
liches, aber technisch abweichendes System mit einer im Vergleich eingeschränkteren Umsetzung 
(vgl. Kapitel 3, Davoody et al. 2019, Hägglund et al. 2018). Die primären Zwecke solcher Systeme 
liegen in der Verbesserung der Koordination der Versorgung und in einer erhöhten Transparenz für die 
Patienten, nicht zuletzt, um deren Empowerment zu fördern. Regulären Zugriff auf die Daten haben 


dabei die Patienten selbst sowie die Leistungserbringer. Ein Zugriff für Forscher würde eine zusätzli- 
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che bzw. sekundäre Funktionalität darstellen. Zum Beispiel bietet das schwedische Health Information 
Exchange theoretisch auch Anwendungen für Forscher, ihre Umsetzung ist aber unklar (Sellberg & 
Eltes 2017). 

In den letzten Jahren haben einzelne Länder in der Stichprobe Initiativen eingeführt, die elektronische 
Patientenakten anbieten und somit potenziell auch neue Datensätze für die Forschung schaffen könn- 
ten. Dabei gibt es in Australien sowie in Österreich die Möglichkeit für Patienten, entweder ganz aus 
der Nutzung der elektronischen Akte auszusteigen oder aber bestimmte Eintragungen nicht vornehmen 
zu lassen bzw. diese nicht in der Akte freizugeben (Vgl. Tabelle 7.1). In Australien werden darüber 
hinaus die Patienten informiert, wenn ein Leistungserbringer auf ihre Akte zugreift. In Australien kön- 
nen die Daten der „MyHR“ für Forschungszwecke genutzt werden, vorausgesetzt die Patienten haben 
einer Nutzung ihrer Daten für die Forschung nicht widersprochen. Das österreichische Modell sah 
zwar eine ähnliche Nutzung für die Forschung vor, aber der politische Wille für ihre Umsetzung soll 
ausgeblieben sein. Die aktuellen Planungen für die deutsche elektronische Patientenakte (ePA; $291a 
SGBV) weichen von den identifizierten Modellen in den anderen Ländern ab. Aktuell ist ein doppeltes 
„opting-in“-Verfahren geplant, d.h. die Versicherten erhalten über ihre Krankenkasse die Möglichkeit 
an der ePA teilzunehmen und melden sich für diese an. Darüber hinaus können die Daten für die For- 
schung bereitgestellt werden, auch hierfür melden sich die Versicherten an. International wurden keine 
Erfahrungen mit einer vergleichbaren Nutzung der Daten aus elektronischen Patientenakten für die 
Versorgungsforschung identifiziert; entsprechende Überlegungen und Vorschläge sind daher eher 
tentativ. Es leuchtet aber ein, dass je nachdem wie viele und welche Patienten sich für oder gegen die 
Nutzung von solchen Anwendungen entscheiden und gemäß den genauen Gestaltungsmöglichkeiten 
der Zugriffsrechte, die Vollständigkeit und Repräsentativität der Daten maßgeblich eingeschränkt sein 
könnten (vgl. Kapitel 8). 
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Tabelle 7.1 Zugriffsmöglichkeiten und Patientenrechten bei elektronischen Patientenakten 


Land Initiative Zugriff Opt-out / Bestimmung Zusätzliche Möglichkei- 
der Datensichtbarkeit ten für die Forschung 
| MyHealthRecord Patienten und Leis- | Patienten: opt-out of | Zugriff auf die Daten 
(MyHR) tungserbringer MyHR, ausgewählte Leis- | zukünftig möglich gegen 
haben regulär Zu- tungserbringer einschrän- | Gebühr, ausschließlich 
griff auf die Daten | ken, bestimmte Unterlagen | der Daten von Bürgern 
verbergen; Benachrichti- die nicht MyHR vollstän- 
Australien gung, wenn Leistungser- dig oder für die For- 
bringer auf myHR zugrei- | schung widersprochen 
fen. Opt-out aus der Nut- haben. 
zung für Forschung. 
Leistungserbringer: Opt- 
out 
Sundhed.dk Patienten und Leis- | Nein Nein 
3 tungserbringer 
Panem ak haben regulär Zu- 
griff auf die Daten 
ELGA (Elektro- | Patienten und Leis- | Patienten: Ganz und parti- | Reguliert, aber nicht 
nische Gesund- | tungserbringer ell (letzteres für einzelne umgesetzt 
Österreich | heitsakte) (Umsetzungsphase), | Anwendungen, z.B. eBe- 
letztere mit Zeitein- | funde) 
schränkung 
Journalen (An- Patienten und Leis- | Implementierung bei Re- Nein 
wendung des tungserbringer gion. Für alle Patienten, 
Schweden | PAEHR - “pa- Leistungserbringer können 


tient-accessible 
electronic health 
record”) 


Beitrag einschränken 
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Kapitel 8: Zwischenfazit zu den Ergebnissen und Limitationen des Gut- 
achtens 


Die in den bisherigen Kapiteln thematisierten Fallstudien aus dem internationalen Vergleich heben 
wichtige Aspekte hervor, die für die Problematik in Deutschland von Bedeutung sein könnten. Eine 
Nebeneinanderstellung der in Deutschland vorhandenen Datenbestände (Tabelle 1.2) und der in ande- 
ren Ländern eingesetzten Daten (hauptsächlich in Kapiteln 3 und 4 dargestellt) deutet darauf hin, dass 
sich die Diskussion hierzulande an erster Stelle mit der Ausgestaltung der zur Verfügung stehenden 
Daten befassen sollte und ergänzend die Erfassung zusätzlicher Informationen bedenken kann. Kon- 
krete Empfehlungen werden in Kapitel 9 entwickelt. 

Neben dem Mehrwert von vergleichsmäßig einfach zugänglichen, umfangreiche(re)n Abrechnungsda- 
ten, die schneller als in Deutschland vorliegen, sektorenübergreifende Analysen erlauben und perso- 
nenbezogen mit Gesundheits- sowie auch mit Regionaldaten verknüpfbar sind (z.B. MBS/PBS in 
Australien, NHIS/HIRA in Südkorea, CMS Data in den USA), beleuchtet Kapitel 4 auch das Potential 
von Datenbanken, die auf Basis der routinemäßigen Dokumentation (i.d.R. elektronischen Gesund- 
heitsakten) von Leistungserbringern entstehen (z.B. CPRD, Nivel PC Database). Eine Investition in 
diese Richtung, wie sie zum Beispiel in Großbritannien mit CPRD erfolgte (Gothe 2015; Gentil et al. 
2017), kann nicht nur für das eigene Gesundheitssystem Einsichten ermöglichen, sondern auch die 
internationale Kooperation fördern und zur internationalen Sichtbarkeit wissenschaftlicher Exzellenz 
beitragen (vgl. Vezyridis & Timmons 2016); teilnehmende Praxen können von periodischen Berichten 
sowie eine Möglichkeit zum Benchmarking profitieren. Allerdings muss unbedingt beachtet werden, 
dass eine Reihe von Verzerrungsquellen die Forschung auf Basis von Daten aus elektronischen Ge- 
sundheitsakten erschweren können. Dies betrifft unter anderem die Dokumentation und Kodierung in 
der elektronischen Akte, die Extraktion und Zusammenführung der Daten sowie die Aufbereitung für 
die wissenschaftliche Praxis (Agniel, Kohane & Weber 2018; Verheij et al. 2018). Die Repräsentativi- 
tät der Stichprobe bei Netzwerken teilnehmender Praxen (wie beim CPRD und der Nivel Database) 
muss beachtet werden, sowie die Vollständigkeit der Daten; beides wird davon beeinflusst, welche 
Möglichkeiten Patienten zur Verfügung stehen, ihre Daten aus dem Forschungszugriff auszuschließen 
(vgl. auch Kapitel 7). Zum Beispiel wurde im NHS zusammen mit der Umsetzung der DSGVO im 
Jahr 2018 das sogenannte „National Data Opt Out“ eingeführt, ein Dienst, der es Patienten ermöglicht, 
den Zugriff auf ihre vertraulichen Daten zu regeln; alle Institutionen im Gesundheitssystem müssen bis 
März 2020 mit der Regelung konform sein. 

In der in Deutschland vorgesehenen, aber noch nicht abschließend vorliegenden Regelung zur elektro- 
nischen Patientenakte sollen Patienten die Datenhoheit behalten und sich freiwillig sowohl für die 
Akte an sich als auch für die Nutzung ihrer Daten für die Forschung entscheiden (doppeltes ,,opt-in“). 
Somit würden Daten, die über die ePA generiert bzw. spendiert wurden, ähnlichen Limitationen unter- 


liegen. 
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Die Vielfältigkeit der Datenbestände zu den unterschiedlichen Kategorien im Analysekonzept des 
Gutachtens (vgl. Abbildung 2.1) ist kein Alleinstellungsmerkmal Deutschlands. In diesem Gutachten 
wird eine Reihe von Initiativen dargestellt, die genau aufgrund eines Bedarfs an verlinkten Daten den 
Zugang für die Forschung vereinfachen sollen. Diese umfassen sowohl integrierte Modelle (wie die 
IDI in Neuseeland) als auch zentrale Zugangsstellen für die Beantragung und Verlinkung verteilter 
Datenbestände unterschiedlicher Datenhalter (z.B. PHRN in Australien, SDLE in Kanada, eDRIS in 
Schottland; in allen Ländern sind parallel auch regionale Initiativen aktiv). Unter der Rubrik „Daten- 
angebot“ bieten die Forschungsdatenzentren der statistischen Ämter der Bundesländer in Deutschland 
auf ihrer Webseite eine Übersicht vorhandener Daten'; hierauf ließe sich in diese Richtung aufbauen. 
Zusätzlich zu den schon genannten Beispielen könnten Plattformen wie das Forschungszentrum (Res- 
DAC) und der Data Navigator des CMS in den USA herangezogen werden. Aus den strategischen 
Bemühungen in den Vergleichsländern (vgl. Profile im Anhang und Kapitel 3) wird deutlich, dass ein 
starkes politisches Engagement für eine erfolgreiche Umsetzung neuer Wege für die Versorgungsfor- 
schung ausschlaggebend ist (vgl. auch Tew et al. 2017). 

Das Konzept des ,,one-stop-shop“ für Daten, also einer Stelle, die alle bürokratischen Schritte koordi- 
niert bzw. durchführt und somit die Prozesse für Beantragende vereinfacht, dient nicht nur der Entlas- 
tung der Forscher bzw. Politikanalysten, sondern auch einer besseren und effizienteren Nutzung aller 
Daten und somit der Formulierung und Beantwortung weitreichender Fragestellungen. In diese Rich- 
tung gibt es auch neuere Bemühungen, wie etwa in Finnland mit Findata. Auf europäischer Ebene 
steht die Möglichkeit eines European Health Data Space vor, welches die Möglichkeiten bestehender 
und neuer Daten auch grenzüberschreitend einsetzen soll. Erste Initiativen für den grenzüberschreiten- 
den Austausch gesundheitsbezogener Daten sind bereits unterwegs (Paun 2019). Die deutsche Präsi- 
dentschaft des Europäischen Rates in der zweiten Hälfte 2020 soll das Konzept aktiv fördern (von der 
Leyen & Spahn 2019). 

Das Gutachten hat sich auf die Vorstellung und Diskussion selektierter Fallstudien beschränkt; somit 
ist davon auszugehen, dass auch andere Länder interessante Impulse für Deutschland anbieten können, 
oder sogar weitere Initiativen in den eingeschlossenen Ländern. Darüber hinaus war eine detaillierte 
Analyse von datenschutzrechtlichen Regelungen nicht Teil der Zielsetzung des Gutachtens; wichtige 
Regelungen wurden pro Land erfasst, um eine Grundlage für weiterführende Recherchen bereitzustel- 
len. Das Gutachten hat nicht ein Benchmarking der eingeschlossenen Fallstudien beabsichtigt, weder 
im Sinne der Qualität, Vollständigkeit und Repräsentativität der Daten noch hinsichtlich ihrer a priori 
Übertragbarkeit für Deutschland. Vielmehr wurde es als zielführend erachtet, hilfreiche Aspekte zu 
beleuchten und ihre Umsetzung über die Fallstudien hinweg zu diskutieren. Eine Limitation des Gut- 
achtens liegt in dem Umfang der Erfahrungsberichte mit den eingeschlossenen Fallstudien; es ist nicht 
auszuschließen, dass über die öffentlich zugänglichen Quellen bzw. über die Konsultation der Landes- 


experten nur selektiv Informationen zu prozeduralen Aspekten oder zu Datensicherheitserwägungen 


t https://www.forschungsdatenzentrum.de/de#datenangebot 
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identifiziert wurden. Die Nutzung und Auswertung von unstrukturierten Daten sind unter den einge- 
schlossenen Initiativen nicht häufig vertreten, spielen aber in den Diskussionen um Big Data eine 
wichtige Rolle. Auch die explizite Beschäftigung mit Umweltdaten konnte nicht ausführlich beleuch- 
tet werden, obwohl diese in vereinzelten Projekten verlinkt wurden (vgl. Tabellen 4.1 und 4.3). Hierzu 


sind weiterführende Recherchen erforderlich. 
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Kapitel 9: Umsetzungsmöglichkeiten für Deutschland 


Obwohl in Deutschland große Datenbestände vorliegen, welche relevante Informationen für die Ver- 
sorgungsforschung enthalten (vgl. Tabelle 1.2), sind die praktischen Möglichkeiten zur Nutzung dieser 
Daten als „eingeschränkt“ zu bezeichnen. Idealerweise ist für die Versorgungsforschung ein Zugriff 
auf Daten möglich, welche die nachfolgenden Kriterien erfüllen. Die Daten sollen: 

e auf Individualebene vorliegen, d.h. nicht nur auf aggregierter Ebene (,,Mikrodaten“) 

e möglichst alle relevanten Versorgungssektoren umfassen, und innerhalb der Sektoren sowohl 
die Leistungen als auch die Leistungserbringer; somit wäre auch eine Aggregation auf ent- 
sprechender Ebene möglich 

e über längere Zeiträume vorliegen, und über die Jahre verknüpfbar sein, so dass die jeweils ak- 
tuellsten Daten zugespielt werden können 

e die gesamte Bevölkerung abdecken 

e auch Informationen zu nicht-medizinischen, d.h. etwa soziodemographischen/ sozioökonomi- 
schen Parametern sowie regionale Informationen (z.B. PLZ oder Wohnort) enthalten 

e auch auf aggregierter (etwa regionaler) Ebene verknüpfbar sein (etwa mit Informationen zur 
Lokalisation oder Dichte von Leistungserbringern, regionalen/ KV-Daten zur durchschnittli- 
chen Inanspruchnahme oder Leistungserbringung, aber auch mit anderen Datenbeständen, z.B. 
hinsichtlich regionaler Umweltfaktoren) 

Des Weiteren sollten für die wissenschaftliche Datennutzung bestimmte Kriterien erfüllt werden. Ins- 
besondere sollen: 

e transparente Regelungen hinsichtlich der Nutzungsberechtigungen vorliegen 

e gleiche Bedingungen für alle wissenschaftlichen Institutionen für einen Datenzugriff gelten 

e eine möglichst geringe zeitliche Differenz zwischen Datenerhebung und möglichem Daten- 
zugriff bestehen 

e eine zeitnahe Bearbeitung des beantragten Datenzugriffs erfolgen 

e Möglichkeiten für einen direkten Zugriff auf die Mikrodaten — unter den entsprechenden da- 
tenschutzrechtlichen Bestimmungen — vorhanden sein (in Ergänzung zur Datenfern- 
verarbeitung) 

Die in Deutschland vorliegenden und für die Versorgungsforschung nutzbaren Datenbestände sind 
aktuell weit davon entfernt, diese Kriterien zu erfüllen. Die verfügbaren Daten sind fragmentiert, teil- 
weise unvollständig und erlauben nur selten sektorenübergreifende Analysen oder eine Verknüpfung 
mit anderen Daten. Darüber hinaus stellen die (teilweise nicht vorhandenen bzw. intransparenten) 
Zugriffsregelungen die VersorgungsforscherInnen vor weitere Hürden und verursachen einen immen- 
sen Arbeitsaufwand. Basierend auf internationalen Erfahrungen, wie sie in Kapiteln 3 bis 9 und im 
Anhang dieses Gutachtens dargestellt werden, wurden daher vier (sich z.T. ergänzende bzw. aufeinan- 


der aufbauende) Szenarien entwickelt, welche einzeln bzw. in Kombination, die Datenverfügbarkeit 


63 


für die Versorgungsforschung in Deutschland verbessern könnten. Der grundsätzliche Anspruch an 
höchste Datenschutzstandards und an die Bewahrung der Anonymität von Personen wird durchgehend 


als unabdingbare Voraussetzung betrachtet. 


a) Ausweitung des bestehenden verknüpften GKV-Datenkranzes (DaTraV Daten) und Verbes- 
serung des Datenzugriffs 

Der umfangreichste, sektorenübergreifende und im Längsschnitt verknüpfbare Datensatz in Deutsch- 
land liegt den gesetzlichen Krankenkassen (jeweils für ihre eigenen Versicherten) vor. Mit der Neure- 
gelung der $$ 303a-e SGB V im Jahr 2012 wurde ein Datenbestand geschaffen, in dem die Daten aller 
gesetzlichen Krankenkassen zusammengeführt sind und dessen Nutzung der Aufgabenerfüllung ver- 
schiedener Institutionen des Gesundheitswesens sowie der wissenschaftlichen Forschung dienen soll. 
Mit der Aufbereitung und Bereitstellung der Daten ist das Deutsche Institut für Medizinische Doku- 
mentation und Information (DIMDI) beauftragt. Der unter der Bezeichnung ,,Informationssystem Ver- 
sorgungsdaten“ bereitgestellte Datenbestand beruht auf den jährlichen Datenübermittlungen der ge- 
setzlichen Krankenkassen an das Bundesversicherungsamt zum Zweck der Weiterentwicklung des 
morbiditätsorientierten Risikostrukturausgleichs (Morbi-RSA). 

Da bislang jedoch nur die ftir die Berechnung des Morbi-RSA relevanten Informationen von den 
Krankenkassen, bzw. vom Bundesversicherungsamt an das DIMDI übermittelt werden, ist dieser Da- 
tensatz für die Versorgungsforschung nur eingeschränkt nutzbar. So sind u.a. derzeit die Daten 
verstorbener Personen im Sterbejahr nicht im Datensatz enthalten, ebenso fehlen Operations- und Pro- 
zedurencodes aus der stationären und ambulanten Versorgung. Auf Grund dieser fehlenden Informati- 
onen kann beispielsweise nicht analysiert werden, wie sich nach 30, 90 oder 365 Tagen die Mortali- 
tät/Morbidität nach einem Schlaganfall zwischen Patienten mit Behandlung in einer Stroke-Unit und 
Patienten ohne Behandlung in einer Stroke-Unit (abbildbar über den OPS-Code) unterscheidet. 

Aktuell kann diese Frage nur mit anderen Datensätzen analysiert werden, die jeweils ebenfalls spezifi- 
sche Einschränkungen aufweisen: entweder nur für den Zeitraum der Krankenhausbehandlung selbst 
(Krankenhausfalldaten gemäß $21 KHEntgG), in Kooperation mit einzelnen Krankenkassen nur für 
die entsprechende Versichertenpopulation oder anhand der Daten der Schlaganfall-Register, die auf- 
grund der freiwilligen Teilnahme der Kliniken i.d.R. keine vollständige Erhebung darstellen. 

Bei einer Ausweitung des DaTraV Datensatzes (auch rückwirkend für die bereits vorliegenden Jahre) 
um alle den Krankenkassen vorliegenden Informationen könnten zahlreiche wichtige Forschungsfra- 
gen vollständig analysiert werden (vgl. HIRA in Südkorea). Zur angemessenen Evaluation von Inno- 
vationen in der Gesundheitsversorgung (z.B. gesetzliche Neuregelungen, Einführung von Medikati- 
onsplänen) sind longitudinale Studien unabdingbar; darüber hinaus sind die Effekte von vielen Inter- 
ventionen, wie z.B. Stroke Units, unter Umständen erst über einen längeren Zeitraum erkennbar. Es ist 
also essenziell, dass die Daten auch als Panel analysiert werden können. Wünschenswert wäre, dass 
die Krankenkassen einen definierten Auszug ihrer Daten gemäß $ 284 SGB V direkt an die Datenauf- 
bereitungsstelle übermitteln. Dies würde auch dazu beitragen, die große Zeitverzögerung, mit der die 
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Daten derzeit zur Verfügung stehen, zu verringern, wie es in anderen Ländern (wie zum Beispiel in 
Kanada, Neuseeland und den USA) bereits erfolgt ist. Eine weitere Verringerung der Zeitverzögerung 
ließe sich mit unterjährigen (beispielsweise quartalsweisen) Datenlieferungen erreichen. 

Neben den Einschränkungen des Datensatzes erschweren derzeit auch lange Bearbeitungszeiten für 
Nutzungsanträge und prozessuale Hürden bei der Durchführung von Analysen die Datennutzung. 
Aufgrund der Erfahrungen und bisherigen Ergebnisse wäre es wünschenswert, die in den $$ 303b und 
303d SGB V genannten Aufgaben des Forschungsdatenzentrums einer Stelle zu übertragen, die mit 
der Bereitstellung von Forschungsdaten Erfahrung hat und über die erforderlichen technischen und 
personellen Ausstattungen sowie Prozesse verfügt. Eine Akkreditierung des Forschungsdatenzentrums 
durch den Rat für Sozial- und Wirtschaftsdaten (RatSWD) wäre vorteilhaft. Als (bereits akkreditiertes) 
Forschungsdatenzentrum wäre z.B. das Statistische Bundesamt geeignet, dessen Forschungs- 
datenzentrum zahlreiche Arten von Forschungsdaten für wissenschaftliche Auswertungen nutzer- 
freundlich auf verschiedenen Wegen zugänglich macht. Daneben könnten die DaTraV Daten dann 
auch zur Erstellung von Bundesstatistiken verwendet werden. Ähnliche Modelle sind international 
schon umgesetzt (zum Beispiel in Kanada, Neuseeland und Schottland). 

Zur Auswertung der DaTraV Daten ist zudem eine Ausweitung der Zugriffsmöglichkeiten über die 
aktuell bestehende Datenfernverarbeitung wünschenswert. Dies betrifft u.a. die Schaffung von Gast- 
wissenschaftlerarbeitsplätzen (wie an den „safe havens“ des Britischen NHS, in Neuseeland oder auch 
in Südkorea) sowie idealerweise einen direkten Datenzugriff mittels sicherer Verbindung (bspw. über 
einen Terminalserver, wie das SURE-System in Australien oder der VPN-Zugang zum kanadischen 
Population Data BC). Technische und datenschutzrechtliche Möglichkeiten, wie die Daten der gesetz- 
lichen Krankenkassen leichter für die Forschung zugänglich gemacht werden können, haben dabei 
schon einzelne Krankenkassen ausgearbeitet und umgesetzt (ein Beispiel bietet das Wissenschafts- 
Data-Warehouse der BARMER). 

Das Digitale-Versorgung-Gesetz (DVG, BGBl. vom 9.12.2019) soll die Nutzbarkeit der GKV- 
Routinedaten für Forschungszwecke auf der Grundlage der $$ 303a-e verbessern. Es sieht die Schaf- 
fung einer Datenbasis vor, welche auf der Individualebene Angaben zu Alter, Geschlecht und Woh- 
nort, Angaben zum Versicherungsverhältnis, Kosten- und Leistungsdaten nach den $$ 295, 295a, 300, 
301, 30la und 302 SGB V, Angaben zum Vitalstatus und zum Sterbedatum sowie Angaben zu den 
abrechnenden Leistungserbringern enthalten soll. Zur Wahrnehmung der Aufgaben des Forschungsda- 
tenzentrums soll eine öffentliche Stelle des Bundes per Rechtsverordnung bestimmt werden. Auch Art 
und Umfang der Daten, sowie die konkreten Zugriffsregelungen werden per Rechtsverordnung neu 
bestimmt. Da diese noch nicht vorliegt, können diese Aspekte noch nicht beurteilt werden. Wün- 
schenswert wäre, dass im Vorfeld der neuen Rechtsverordnung die zukünftigen Datennutzer (insbe- 
sondere aus dem Bereich der Versorgungsforschung) mit einbezogen oder zumindest angehört werden. 
Um die Möglichkeiten einer Verlinkung zwischen Mikrodaten und Regionaldaten entfalten zu können, 


wäre bezüglich der Angaben zum Wohnort der Einschluss von Postleitzahlen notwendig. 
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Auch wenn die Neuerungen des Digitale-Versorgung-Gesetzes auf Verbesserungen des Datenangebots 
und der Zugangsmöglichkeiten hoffen lassen, muss jedoch beachtet werden, dass sich die DaTraV 
Daten nur auf Versicherte und Leistungsbereiche der gesetzlichen Krankenversicherung beziehen und 
damit Teile der Bevölkerung (Privatversicherte) sowie bestimmte Leistungsbereiche der Gesundheits- 


versorgung (z.B. Rehabilitation zu Lasten der gesetzlichen Rentenversicherung) nicht erfasst werden. 


b) Koordinierende Instanz, die eine Verlinkung bestehender Daten ermöglicht (Clearingstelle 
Gesundheitsdaten?) 
Eine darüber hinaus gehende Möglichkeit, die Datenbasis für die Versorgungsforschung zu verbes- 
sern, ist die Verknüpfung bereits bestehender Datenbestände (innerhalb der GKV und darüber hinaus). 
Aktuell stellt die Verknüpfung bestehender Datenbestände Forscher vor zwei wesentliche Herausfor- 
derungen: i) die variierenden Zugangsregelungen zu den verschiedenen Daten stellen eine Hürde an 
sich dar und ii) viele der Datensätze liegen pseudonymisiert und ohne eindeutigen Verknüpfungs- 
schlüssel vor, so dass Forscher vor der Herausforderung des Datenlinkage stehen. Der Zugriff auf die 
Daten sowie die Durchführung eines Linkage gehen bei jedem Forschungsprojekt mit umfangreichen 
Anträgen zur Datennutzung, Datenschutzkonzepten sowie ggf. notwendigen Ethikanträgen — und so- 
mit einem hohen Arbeitsaufwand - einher. 
Mittels einer Koordinierungs- und Datenverlinkungsstelle könnten diese Probleme sowie der Aufwand 
für Zugriff und Verlinkung erheblich minimiert werden. International liegen viele positive Beispiele 
für die Nutzung von Koordinierungs- und Datenverlinkungsstellen vor (u.a. die „electronic data rese- 
arch infrastructure‘, das „social data linkage environment“ (SDLE) in Kanada, Population Data BC 
in Kanada sowie das Population Health Research Network in Australien). Während sich der Umfang 
der zur Verfügung stehenden Daten sowie das genaue Prozedere sowohl der Datenverknüpfung als 
auch des Datenzugriffs unterscheiden, sind die Leitideen der verschiedenen Initiativen identisch: 
e Ziel: eine verbesserte Datenverfügbarkeit für die Wissenschaft, um so eine evidenzbasierte 
Gesundheitspolitik zu fördern und die Gesundheit der Bevölkerung zu verbessern 
e Verwendung von bereits bestehenden Datenbeständen 
e Ein Zugriffspunkt für Wissenschaftler, über den Informationen zu den vorhandenen Daten so- 
wie den Analysemöglichkeiten gegeben werden, sowie die Verknüpfung verschiedener Daten- 
bestände durchgeführt wird 
e Uber die Koordinierungs- und Datenverlinkungsstelle wird die Einhaltung datenschutzrechtli- 
cher Auflagen sichergestellt 
e Zusammenfassend sollen die Hürden sowie die Arbeitslast für die Nutzung der Datenbestände 
reduziert werden und so eine effizientere Nutzung der Ressourcen ermöglicht werden 
Die Verknüpfung bestehender Daten ermöglicht insbesondere sektorenübergreifende Langzeitanaly- 
sen. Beispielsweise könnte die Versorgung bei Krebserkrankungen von der Diagnose über die Thera- 
pie (stationär, ambulant, Rehabilitation, Medikation etc.) bis zu einem definierten Endpunkt (z.B. 5- 


Jahres-Überleben) analysiert werden (vgl. auch Beispiele aus den Vergleichsländern in Tabelle 4.3). 
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Für Deutschland wäre der Aufbau einer solchen Koordinierungs- und Verlinkungsstelle wichtig, da 
hierbei prinzipiell alle verfügbaren Daten berücksichtigt werden könnten. Zu fordern wäre ein ver- 
knüpfbarer Datenbestand von Daten aller Sozialversicherungsträger und möglichst auch der Privaten 
Krankenversicherungen, sowie von Daten der Todesursachenstatistik und weiteren Daten (etwa von 
Leistungserbringern oder Registern). 
Möglichkeiten zur Datenverknüpfung sind gegeben. Wie bereits internationale Beispiele als auch Bei- 
spiele aus Deutschland zeigen, ist ein Datenlinkage auch ohne einheitliche Schlüsselvariable, bei- 
spielsweise durch die Kombinationen verschiedener Informationen (bspw. mittels probabilistischem 
Linkage) möglich. Wünschenswert wäre jedoch die Verwendung eines einheitlichen Pseudonyms, das 
bei der Datengenerierung an verschiedenen Stellen in einheitlicher Weise vergeben wird und damit 
eine sichere Verknüpfung ermöglicht. 
Die koordinierende Instanz sollte die folgenden Daten verknüpfbar zur Verfügung stellen bzw. den 
Zugriff und die Verknüpfung koordinieren: 
e = auf Individualebene verlinkbar 
= Daten aller gesetzlichen Krankenkassen 
= Daten der privaten Krankenversicherungen nach gleicher Schnittstellendefinition 
= Daten der gesetzlichen Rentenversicherung 
= Daten der gesetzlichen Unfallversicherung 
= Ggf. zukünftig Daten der elektronischen Patientenakte 
= Gef. zukünftig Befragungsdaten (z.B. hinsichtlich subjektiver Gesundheit, Erfahrungen 
mit dem Gesundheitssystem), welche notwendige Informationen für die Verlinkung sowie 
das Einverständnis der Befragten erfassen 
e auf aggregierter Ebene verlinkbar (bspw. Regionen oder auch per Institutskennzeichen) 
= Auf Ebene der Leitungserbringer aggregierte Daten von kassenärztlichen Vereinigungen 
und Krankenhäusern (auch IQTIG) 
= Daten der Todesursachenstatistik 
= Gef. weitere Daten (z.B. Krebs- und Implantateregister, bestehende Befragungsdaten 
(bspw. des RKI) 
Des Weiteren sollte angestrebt werden, dass auch Daten aus einzelnen Forschungsprojekten mit die- 
sem Datenbestand verknüpft werden können. So könnten z.B. Daten aus Befragungen oder auch aus 
Randomisierten Kontrollierten Studien (nach Zustimmung der Studienteilnehmer) mit den vorliegen- 
den Routinedaten verknüpft werden, um die Effizienz der Datenerhebung zu erhöhen und ggf. weitere 
Analysen zu ermöglichen. Ein gutes Beispiel bietet hier die Initiative Population Data BC aus Kanada. 
Ein denkbares Vorgehen wäre, dass Studienteilnehmer um die Bereitstellung ihrer Krankenversiche- 
rungsnummer oder anderer Informationen gebeten werden, die eine Verknüpfung der späteren Daten 
über die Datenverlinkungsstelle möglich machen. Über die Datenverlinkungsstelle bzw. die Vertrau- 


ensstelle könnten dann die Daten mittels der bereitgestellten Informationen verlinkt werden und an- 
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schließend ein verknüpfter und pseudonymisierter Datensatz für die Auswertung bereitgestellt werden. 
All dies natürlich nur unter der Zustimmung der Studienteilnehmer und Einhaltung der datenschutz- 
rechtlichen und ethischen Bestimmungen. Dieser pseudonymisierte Datensatz sollte auch anderen 
Wissenschaftlern zugänglich gemacht werden (ggf. nach Einhaltung einer Schutzfrist), um so den 
größtmöglichen Nutzen aus den generierten Daten zu erhalten. 

Für Forschungszwecke wäre es somit ausreichend, wenn die Daten bei der Datenaufbereitungs- und 
Verlinkungsstelle in pseudonymisierter Form vorlägen. Für Zwecke der ggf. projektspezifischen Ver- 
knüpfung mit weiteren Daten könnte dann zusätzlich auch die Möglichkeit einer De- 
Pseudonymisierung angedacht werden. 

Ein Datenbestand in der hier beschriebenen Art würde einen erheblichen Fortschritt für die Versor- 
gungsforschung, für die Weiterentwicklung der medizinischen Qualität und eine evidenzbasierte Ge- 
sundheitspolitik in Deutschland beinhalten. Die gesetzlichen Regelungen für eine solche umfassende 


Datenzusammenführung müssten vermutlich größtenteils neu geschaffen werden. 


c) Erweiterung des Datenkranzes durch freiwillige Bereitstellung der Daten der elektronischen 
Patientenakte 

Bis Januar 2021 soll in Deutschland die elektronische Patientenakte (ePA) eingeführt werden. Die 
bisherigen Überlegungen zur ePA waren Teil des Referentenentwurfs des Digitale Versorgung- 
Gesetzes (DVG) vom 15.5.2019. Nach der Revision des Entwurfs (Kabinettsentwurf vom 10. Juli 
2019, siehe oben), wurden die Regelungen zur ePA jedoch entfernt, da diese in einem eigenen Daten- 
schutzgesetz ausgeführt werden sollten. Dies geschah 2020 mit dem Gesetz zum Schutz elektronischer 
Patientendaten in der Telematikinfrastruktur (Patientendaten-Schutzgesetz, PDSG). 

Nach Einführung der ePA können Versicherte auf eigenen Wunsch die Daten ihrer Akte für die Nut- 
zung zu Forschungszwecken zur Verfügung stellen ($ 363 SGB V). Somit steht zukünftig eine weitere 
potenzielle Datenquelle für die Versorgungsforschung zur Verfügung. 

In der ePA „sollen den Versicherten auf Verlangen Informationen, insbesondere zu Befunden, Diag- 
nosen, durchgeführten und geplanten Therapiemaßnahmen sowie zu Behandlungsberichten, für eine 
einrichtungs-, fach- und sektorenübergreifende Nutzung für Zwecke der Gesundheitsversorgung, ins- 
besondere zur gezielten Unterstützung von Anamnese und Befunderhebung, barrierefrei elektronisch 
bereitgestellt werden“ (8341 SGB V i.d.F. des PDSG). Daneben können u.a. auch Daten zum Nach- 
weis der regelmäßigen Inanspruchnahme zahnärztlicher Vorsorgeuntersuchungen, Daten zur Früher- 
kennung von Krankheiten bei Kindern (elektronisches Untersuchungsheft für Kinder), Daten über die 
ärztliche Betreuung während der Schwangerschaft und nach der Entbindung (elektronischer Mutter- 
pass), Daten der Impfdokumentation (elektronische Impfdokumentation), Gesundheitsdaten, die durch 
den Versicherten zur Verfügung gestellt werden, Daten des Versicherten aus einer von den Kranken- 
kassen finanzierten elektronischen Akte des Versicherten oder bei den Krankenkassen gespeicherte 
Daten über die in Anspruch genommenen Leistungen des Versicherten, Daten, die der Versicherte 
seiner Krankenkasse für die Nutzung in zusätzlichen von der Krankenkasse angebotenen Anwendun- 
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gen nach $ 345 Absatz 1 Satz 1 zur Verfügung stellen kann, Daten zur pflegerischen Versorgung des 
Versicherten, Daten elektronischer Verordnungen, die ausgestellten Bescheinigungen über eine Ar- 
beitsunfähigkeit und sonstige von den Leistungserbringern für den Versicherten bereitgestellte Daten 
gespeichert werden. 

Alle gesetzlichen Krankenkassen werden verpflichtet, ihren Versicherten eine ePA anzubieten. Die 
Nutzung der ePA durch die Versicherten ist freiwillig. In den Forschungsdaten basierend auf der ePA 
sind somit nur Personen enthalten, die a) gesetzlich versichert sind, b) sich für die Nutzung der ePA 
entschieden haben und c) ihre Daten freiwillig der Forschung zur Verfügung stellen. Es gibt somit ein 
Doppeltes „opting in“ Verfahren, erst für die Nutzung der ePA und anschließend für die Bereitstellung 
der Daten. 

Dieses Vorgehen kommt im internationalen Vergleich nicht häufig vor. In Australien läuft aktuell die 
Implementierungsphase von „My Health Record“ (MyHR). Im Gegensatz zum deutschen Vorgehen 
sind initial alle Personen, welche die grundlegenden Kriterien erfüllen, in MyHR eingeschlossen. Es 
ist dann möglich, der Teilnahme in MyHR zu widersprechen (opting out). Aktuell wird berichtet (Ex- 
pertenaussage), dass ca. 10 % der Bevölkerung der Teilnahme widersprochen haben. Darüber hinaus 
ist es möglich, ausschließlich der Nutzung der MyHR-Daten für die Forschung zu widersprechen. Hier 
sind bisher keine Zahlen bekannt. Bei MyHR gehören die Daten dem Patienten. Dadurch besteht auch 
die Möglichkeit, der Weitergabe einzelner Daten bzw. der Eintragung bestimmter Informationen zu 
widersprechen (wenn bspw. die psychische Erkrankung nicht Teil der Akte werden soll). Somit kann 
es ggf. zu einer Verzerrung durch „soziale Erwünschtheit“ in den dokumentierten Daten kommen. In 
Österreich können Patienten von der elektronischen Patientenakte ELGA ähnlich wie in Australien 
aussteigen, vollständig oder für bestimmte Anwendungen (z.B. eBefunde). Eine Verfügbarkeit der 
ELGA-Daten zu Forschungszwecken ist zwar regulatorisch avisiert, könnte aber bei der Umsetzung 
schwerfallen. Anekdotischer Evidenz zufolge haben sich die Ausscheidungen nach Bekanntgabe der 
Forschungszugänglichkeit verdreifacht. 

Da sowohl die australischen als auch die österreichischen Erfahrungen nur äußerst eingeschränkt auf 
Deutschland und das doppelte „opting in“ übertragen werden können, können aktuell keine Aussagen 
zur späteren „Vollständigkeit“ des deutschen ePA-Datensatzes getroffen werden. Es muss jedoch in 
jedem Fall bedacht werden, dass die Wahrscheinlichkeit einer Verzerrung durch Nicht-Teilnahme 
hoch ist. So ist es durchaus denkbar, dass gerade Personen, die sich z.B. aufgrund von Krankheit we- 
nig am Öffentlichen Leben beteiligen, und Patienten mit Erkrankungen, die als stigmatisierend emp- 
funden werden, nicht teilnehmen. Dies ist selbstverständlich auch bei einem Opting-Out-Verfahren 
nicht auszuschließen. 

Insgesamt können die Daten damit eher als eine Ergänzung zu bestehenden Daten bzw. zu den aufge- 
führten Szenarien betrachtet werden. Möglichkeiten die ePA-Daten mit anderen, bestehenden Daten zu 
verknüpfen, sollten daher zeitnah überprüft werden bzw. idealerweise direkt bei den anstehenden Ent- 


scheidungen zur Bereitstellung der ePA-Daten mitgedacht werden. Die Nutzung der ePA-Daten als 
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Ergänzung würde die Analyse weiterer Fragestellungen ermöglichen. So erlauben die Daten einen 
detaillierteren Einblick in das Versorgungsgeschehen, als dies über reine Abrechnungsdaten möglich 
ist. Insbesondere sind in der ePA klinische Befunde (z.B. Laborparameter) enthalten. Damit könnten 
beispielsweise Krankheitszustände wie Niereninsuffizienz, Herzinsuffizienz oder chronische Leberer- 
krankung unabhängig von einer (insbesondere im ambulanten Sektor wenig verlässlichen) ICD- 
Kodierung identifiziert und hinsichtlich der Erkrankungsschwere kategorisiert werden. Damit wären 
unter anderem Analysen der Versorgung bei chronischen Erkrankungen in Abhängigkeit von Erkran- 
kungsschwere möglich. Daneben könnten auch Leistungen, die vom Patienten selbst gezahlt werden 
(z.B. Over-the-counter Medikation, IGeL-Leistungen), analysiert werden. International gibt es auch 
Beispiele, wie das SHARE-Register in Schottland (nicht im Gutachten analysiert), die es Patienten 
erlauben, ihre Daten bereitzustellen um als potenzielle Kandidaten für wissenschaftliche Studien iden- 


tifiziert werden zu können. 


d) Erweiterung des Datenkranzes durch freiwillige Datenbereitstellung von Referenznetzen von 
selektierten Leistungserbringern 

Während die unter c) angedachte Erweiterung des Datenkranzes durch die ePA detaillierte Daten zum 
Versorgungsgeschehen auf Patientenebene liefert, ist zudem eine Ergänzung um Referenznetze von 
selektierten Leistungserbringern möglich, um so detailliertere Daten zum Versorgungsgeschehen auf 
Ebene der Leistungserbringer zu erhalten (dies könnte sowohl detaillierte medizinische Daten als auch 
betriebswirtschaftliche Informationen umfassen). Beim Aufbau von Referenznetzwerken kann dabei 
ein Ansatz gewählt werden, der auf in Deutschland bestehende Netzwerke aufbaut (z.B. den Praxen, 
die an den Sentinel-Erhebungen des RKI teilnehmen, oder Praxen des ZI Praxispanels). Darüber hin- 
aus ist auch eine Erschließung von neuen, z.B. regionalen Referenznetzen denkbar. Bei einem Aufbau 
neuer Referenznetze kann u.a. tiefergehend die Koordination der Versorgung analysiert werden und 
um detaillierte Informationen der Leistungserbringer ergänzt werden. Eine ähnliche Zielsetzung hat 
die Nivel PC Database in den Niederlanden. Auf Basis von Routinedaten der ambulanten Versorgung 
wird unter anderem untersucht, inwiefern Leistungserbringer für die Versorgung von einzelnen Patien- 
ten zusammenarbeiten und wie sich gesundheitspolitische Maßnahmen auf die Versorgung auswirken. 
Teilnehmende Praxen bekommen Zugang zu periodischen Feedbackberichten, die ein Benchmarking 
erlauben und zur Qualitätssicherung beitragen können. Zudem könnte anhand selektierter Referenz- 
praxen auch getestet werden, welche weiteren Informationen sinnvolle Ergänzungen zu bereits mögli- 
chen Analysen (bspw. durch Umsetzung der Szenarien a) und/oder b)) darstellen und daher ggf. inner- 
halb größerer Studien erfasst werden sollten. Ein ähnliches Modell bietet der häufig für die Forschung 
herangezogene Clinical Practice Research Datalink (CPRD) im Vereinigten Königreich. Auch hier ist 
wichtig, dass sowohl Leistungserbringer als auch die bei ihnen registrierten Patienten die Möglichkeit 
haben, sich für oder gegen eine Teilnahme zu entscheiden. Die Datenlieferung durch selektierte Leis- 
tungserbringer wird vermutlich immer hohe Einschränkungen bezüglich der Repräsentativität aufwei- 
sen. Daher sollte dieser Vorschlag, ebenso wie Vorschlag c), ausschließlich als Ergänzung zu den Vor- 
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schlägen a) und b) gedacht werden und nicht als alleinstehende Lösung behandelt werden. Für Ge- 
sundheitssysteme ohne „Gatekeeping“-System kommt eine zusätzliche Schicht an Komplexität hinzu: 
hierzulande sind systembedingt insbesondere auch Limitationen bezüglich der Datenvollständigkeit zu 
erwarten, da in der Regel kein einzelner Leistungserbringer (anders als z.B. der Hausarzt in Großbri- 
tannien) im Besitz aller relevanten Daten ist. 

Dieses Gutachten hat das Ziel verfolgt, explorativ interessante Ansätze aus einem internationalen Ver- 
gleich zu identifizieren, die für eine Verbesserung der Datengrundlage für die Versorgungsforschung 
in Deutschland informativ sein können. Eine gründlichere Auseinandersetzung mit einzelnen struktu- 
rellen, technischen und politischen Aspekten ist erforderlich, um eine potentielle Umsetzung der hier 


geschilderten Überlegungen optimal zu unterstützen. 
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Anhang 


Legende für die Steckbriefe pro Fallstudie: Gesundheitsdaten werden mit Dreiecken, Gesundheits- 
versorgungsdaten mit Quadraten, soziodemographische Daten mit Kreisen und Umweltdaten mit 
Sternen gekennzeichnet. 
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Australia (AUS) 


Australia 


Population 24,992,369 1 
Administrative struc- Federal parliamentary democracy under a constitutional monarchy. 2,3 
ture of country 
Jurisdiction of health Three levels of government are collectively responsible for providing uni- 3 
policy versal health care: the federal government, the states/territories and local 
government. The former is responsible for regulating private health insur- 
ance, pharmaceuticals, and therapeutic goods, but has a limited role in 
direct service delivery. 
Current health ex- e 9.4% of GDP 4 
penditure (CHE) and e 4,919.2 USS PPP 
per capita health ex- 
penditure 
Share of spending paid | 17.8 % (2018) 4 
out-of-pocket (OOP) at 
point of use ( % CHE) 
Type of health insur- Healthcare financing in AUS is a combination of public government (at fed- 3,5 
ance and main sources | eral and state levels) funding and private funding. 
of financing (taxation; | public healthcare insurance: Medicare, this regionally administered and 
statutory contribu- federal government-run health scheme, is funded by earmarked income 
tions; pri- taxes, through what is called the Medicare Levy (2 % of taxpayers’ taxable 
vate/voluntary health income), and general tax revenue from the federal and states level of gov- 
insurance premiums; ernment. 
OOP; etc.) A ; : 
Voluntary, private health insurance (VHI): There are two types of VHI in 
AUS: (1) complementary, which provides hospital cover and treatment 
cover for services excluded from Medicare and (2) supplementary, which 
increases choice and faster access to general nonemergency services. VHI is 
financed through private finances; the government encourages registration 
through a tax rebate and a penalty payment called the Medicare Levy sur- 
charge for individuals above a certain income. 
OOP payments: OOP payments are increasing in AUS for services and medi- 
cines that do not fall under the Medicare Benefits Schedule (MBS) or the 
Pharmaceutical Benefits Schedule (PBS). 
Extent of coverage by Medicare: There is universal health coverage, primarily through Medicare, 3, 5, 
insurance type for Australian and New Zealand citizens, permanent residents and people 6, 
from countries with reciprocal agreements. 
VHI: Around 46 % of population has some form of private-patient hospital 
cover; about 55 % of population has a form of general treatment cover. 
Organization of health 
service delivery 
Primary care - Yes; a referral is needed from a GP for a patient to receive MBS subsidies 3 
gatekeeper func- for specialist services. 
tion? 
Specialist outpa- Specialists deliver outpatient care in private practice or in public hospitals; 3 
tient care many specialists split their time between private and public practice. 
Payment mecha- Hospital care: There are both public and private hospitals in AUS. Public 3,6 
nisms hospital payment comes through global budgets from states and case- 


based payment (including physician costs). States finance budgets from a 
combination of tax revenues. Private hospitals are paid via fee-for-service 
through PHI. A DRG payment system (AR-DRG) is in use to match resources 
and activities. 


Primary care: GPs are largely self-employed, work in joint practices and are 


primarily paid fee-for-service, with fees set by the federal health minister 
through MBS; some use of quality-of-care activity incentive payments. 
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Specialist care: Specialists are paid on fee-for service basis; they receive a 
subsidy through the MBS of up to 85 % and can set patients’ OOP fees in- 
dependently. Global budgets and bulk billing are also used to a degree. 


Other: Capitation is employed to a limited degree mainly to fund 
healthcare in under serviced areas, e.g., remote Indigenous communities. 


Examples of health e The Privacy Act of 1988 7,8, 
data protection laws e The Privacy Regulation 2013 9 
e The Privacy Amendment Act 2017 
e The Information Privacy Act 2014 (Australian Capital Territory) 
e The Information Act 2002 (Northern Territory) 
e The Privacy and Personal Information Protection Act 1998 (New 
South Wales) 
e Information Privacy Act 2009 (Queensland) 
e Personal Information Protection Act 2004 (Tasmania) 
e Privacy and Data Protection Act 2014 (Victoria) 
Example of health data | National Digital Health Strategy 10 
strategies 
Index of technical in- N/A 
frastructure 
Relevant actors Australian Government Department of Health: Develops and delivers poli- 7,11 


cies and programs related to health, older people’s care and sport. 


Australian Digital Health Agency: Established in 2016, tasked with improv- 
ing health outcomes via delivery of national digital health services and sys- 
tems, with focus on engagement, innovation and clinical quality and safety; 
it is the system operator of the My Health Record. 

Services Australia: Responsible for delivering a range of welfare, health, 
child support payments and other services to AUS’ population, including 
Medicare and the PBS. 

Australian Institute for Health and Welfare (AIHW): AUS’ national agency 
for information and statistics on health and welfare; holds data on a wide 
range of health and welfare topics. 


Commonwealth Accredited Integrating Authorities and Data Linkage Units 
(DLUs): Agencies that are approved to undertake data linkage, including: 
Population Health Research Network (PHRN) 

e Centre for Victorian Data Linkages (VDL) 

e SA-NT Datalink 

e Data Linkage Queensland (DLQ) 

e Tasmanian Data Linkage Unit (TDLU) 

e Western Australia Data Linkage 
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My Health Record 


Care coordination, patient empowerment, research 
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Dramen OA 
My Health Record contains all information related to a patient’s health 

care, e.g. care planning documents, emergency contact information, 

and reports from tests and scans [ 


At what level is the data aggregated? 
Data aggregated at national level by the 
Australian Digital Health Agency 


Is the data structured? 
No 


Is the data checked or cleaned? 
A Data Management Committee manages 


Who collects the data? operational issues 


Individual patient and 


health care providers is the data linkable? 


Yes, data is linkable through a patient identifier 


Data collection 
Data linkage 
and cleaning 


Where is the data located? Who owns the data? 
Australian Institute of Health Individual patients own their data 


and Welfare is the data Who performs the data linkage? 
En custodian The Australian Digital Health Agency stores and links the 
(o data 
O How long is the data stored? Who has access to data? 
17 Data stored 30 years from Australian-based entities (except insurance 
3 time of death or deleted agencies) can apply to access data for O 
A permanently upon request secondary use aan, 


What is the process for acquiring access? How is the data used for 

Application precondition to access to My Health research purposes? 

Record data for secondary use purposes My Health Record is currently 
being rolled out for research 

How long does it take to become available? purposes 


It varies how long it takes for data 


to become available 
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Australia 


PHRN 


Aggregate and prepare data from around Australia for research 


Data content 

PHRN contains information including 1) health, 2) health care, 

3) administrative, clinical, and registry data. It also has 

4) de-identified demographic data and data on 5) housing, 6) justice, 7) education, 
and 8) some environmental data. 


At what level is the data aggregated? 
The data is aggregated on regional or national 
level 


Isthe data structured? 
Yes 


Isthe data checked or cleaned? 
PHRN supports network of regional data linkage 
units which service each state and territory 


Who collects the data? 
Different agencies or 
programs are 
responsible for 


i ? 
collecting data Is the data linkable? 


Yes, data is linked through patient identifiers 


Data collection 
Data linkage 
and cleaning 


Whereis the data located? Who owns the data? 
The data is located The various agencies and programs collecting the data 
throughout Australia and is serve as custodians 
v managed by the agency Who performs the data linkage? 
(To) responsible for collection Territorial data linkage units perform the data linkage 
te Who has access to data? 
Q Researchers who meet the purpose and 
pe How long is the data stored? ethical requirements and submit ® 
+ N/A a fee are granted access to the 
O data after a period of waiting dm 


What is the process for acquiring access? How is the data used for 
Researchers must complete an application via PHRN research purposes? 
Online Application System as a prerequisite for N/A 

acquiring access 


How long does it take to become available? 
It varies according to the data collection processes 
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MBS 


Health system governance 
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services that are subsidized by the government under the MBS. 
Information is available for all Australian residents and particular categories 
of visitors 


Data content 
The MBS contains a current and historical record of all medical and hospital 


At what level is the data aggregated? 
Data is aggregated at national level but varies 
slightly by jurisdiction 


Isthe data structured? 
Yes 


Is the data checked or cleaned? 
N/A 


Who collects the data? 
The Australian 
Government collects 
the data 


Is the data linkable? 

Yes, data linkable through universal national 
healthcare number which is then provided to 
end-user using a de-identified patient ID 


Data collection 
Data linkage 
and cleaning 


Where is the data located? Who owns the data? 

The data is located with the The Australian Government and the Department of 
Australian Government Human Services own the data 

Who performs the data linkage? 

Linkage must be facilitated either through PHRN or the 
Australian Institute of Health and Welfare (AIHW) 
How long is the data stored? Who ha: access to dala? 


N/A PHRN and AIHW regulate access to data = 
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What is the process for acquiring access? How is the data used for 

Application to the Department of Human Services” research purposes? 

External Request Evaluation Committee (EREC) and The information is used for 

AIHW Ethics essential analysis of the MBS, 
for example investigating 

How long does it take to become available? service use and costs 

Data <5 years old is easily accessible. 

Data > 5 years is archived and the retrieval 


process more lengthy and costly EY 
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Denmark (DNK) 


Denmark 


Population 5,797,446 1 
Administrative struc- Parliamentary constitutional democracy 2 
ture of country 
Jurisdiction of health With Denmark’s decentralized health system, health policy is the joint re- 3 
policy sponsibility of the national government and the regions. The national gov- 
ernment sets the regulatory framework for health services and is responsi- 
ble for general planning, quality monitoring care quality, and licensing as 
well as collecting taxes to be allocated to local governments. Five regions are 
owners of hospitals and responsible for the planning and delivery of special- 
ized health care services and coordination of specialized social care. 
Current health ex- e 10.0 % of GDP 4 
penditure (CHE) and e 5,477.6 USSPPP 
per capita health ex- 
penditure 
Share of spending paid | 14.2 % 4 
out-of-pocket (OOP) at 
point of use ( % CHE) 
Type of health insur- Healthcare financing is mostly a combination of public financing and private 3,5, 
ance and main sources | sources. 6,7 
of financing (taxation; | National health care system: the compulsory, national health care system in 
statutory contribu- DNK is financed through taxes set at the national and local level. Revenues 
tions; pri- from the national level are allocated by the state to regions and municipali- 
vate/voluntary health | ties, mostly as block grants. The municipalities finance around 20 % of re- 
insurance premiums; gional health care services, in order to encourage the municipalities to prior- 
OOP; etc.) itize prevention of disease. Municipal taxation is determined by each munic- 
ipality individually up to a ceiling of 51.5 % of income. A very small part of the 
regions’ funding (1 %) is contingent on the regions’ fulfillment of criteria 
indicating that they cooperate well with the municipalities (Naerhedsfinansi- 
ering), e.g. reduction in hospital contacts per citizen, reduction in number of 
readmissions and increasing use of virtual solutions. 
Voluntary, private health insurance (VHI): There are two types of PHI, pur- 
chased by individuals: (1) complementary voluntary insurance, through al- 
most exclusively, the not-for-profit Danmark, covers statutory cost-sharing, 
benefits excluded in the statutory package and OOP payments and (2) sup- 
plemental insurance to gain access to private providers. 
OOP payments: There is no cost-sharing for hospital and primary services, 
but for dental care, outpatient prescriptions and glasses. There is no cap on 
OOP costs, except for drug OOP spending. 
Extent of coverage by National healthcare system: the national healthcare system provides uni- 3,4, 
insurance type versal healthcare to all registered residents. 6 
VHI: 39 % have complementary coverage for cost-sharing, etc., while around 
26 % have supplementary coverage for access to private providers. 
Organization of health 
service delivery 
Primary care - Yes; citizens are free to choose between two coverage options in the nation- 3,6 
gatekeeper func- al health system (1) to register with a GP of their choice within 15km of their 
tion? home (98 % of covered population) and (2) to not register and be free to 
consult any GP and any specialist without referral. 
Specialist outpa- After referral from a GP, office-based specialists and hospitals-based ambu- 3,6 
tient care latory clinics provide specialist outpatient care. 
Payment mecha- Hospital care: Hospitals in DNK are almost all public and payment mecha- 3,6 
nisms nisms include global budgets from regions. 


Primary care: Most GPs are self-employed and are mainly paid through fee- 
for-service, with some capitation. Regions are responsible for payment, 
though rates are set nationally in agreement with doctors’ associations. 
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Specialist care: Services by private specialists are paid by the regions via fee- 
for-service for referred patients. These fees are set in negotiation with re- 
gions. Private specialists and hospitals can also get OOP payments or fund- 
ing through VHI. Specialists can set their own fees for patients coming with- 
out referral. Specific agreements with regions determine fees for services 
rendered at private institutions for patients referred from public sector. 
Specialist outpatient care delivered in hospitals is paid via the general pay- 
ment mechanisms for hospital care (above). 


Examples of health e EU Regulation 2016/679 (General Data Protection Regulation) 8,9, 
data protection laws e Danish Data Protection Act 2018 (Databeskyttelsesloven) 10 
Example of health With DNK’s latest national “Digital Health Strategy 2018-2022”, elaborated 11, 
data strategies by the Danish Ministry of Health, the Danish Ministry of Finance, Danish 12 
Regions, and Local Government Denmark, the country attempts to create a 
coherent and trustworthy health network for all. 
Index of technical DNK has a strong health data information system, with high health data 13 
infrastructure availability and coverage. It reports lower use of data for re- 
search/monitoring purposes (OECD’s Key national dataset availability, ma- 
turity and use score: 5.70/7.0). 
Relevant actors Ministry of Health (SUM; Sundhedsministeriet): Provides the basis for polit- 3, 6, 
ical decisions in healthcare and elderly care; contributes to formulating 14, 
agendas, developing solutions and ensuring coherence. 15, 
Danish Health Authority (SST; Sundhedsstyrelsen): Responsible for super- 


vising health personnel and institutions and for advising different ministries, 
regions and municipalities on health issues. Recent reforms gave the DHA 
increased power with the responsibility for planning the distribution of med- 
ical specialties among hospitals. 


Regional authorities and municipalities: The five regions responsible for 
GPs, specialists, physiotherapists, dentists, chiropractors and pharmacists 
represented by their interest organizations. Both collect data on healthcare 
services as well as demographic and economic data. 


Statistics Denmark (DST; Danmarks Statistik): A state institution under the 
Ministry of Economic Affairs and the Interior and the central producer of 
statistics in Denmark analyzing social and economic conditions. 


The Danish Clinical Quality Program - National Clinical Registries (RKKP; 
Regionernes kliniske kvalitetsudviklingsprogram): Responsible for ensuring 
continuous improvement in the utilization of registries for clinical, manage- 
rial and research. RKKP facilitates the use of available data, designs new 
registers and works on optimizing existing ones. 


Sundhed.dk: Provides quality assured health information, access to medical 
records and medication, and an overview of Danish health care. It offers a 
shared communication platform; aims for patient empowerment through 
transparency and quality improvement by bringing together all relevant 
information; and offers easy access to individual patients’ clinical infor- 
mation for healthcare providers. 
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Sundhed.dk 


Facilitates data flow and communication between patients, health professionals and 
improves transparency 
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Data content 
Sundhed.dk includes individual level health data such as 1) electronic patient record C) A 


[clinical data, medical history, medications, lab results, etc.) as well as 

2) sociodemographic data and 3) healthcare utilization data (appointments, treatments, 

prescriptions). Aggregated data are also contained, such as 4) health system performance [|] 
[benchmarking service and quality of health services, waiting lists for operations) 


At what level is the data aggregated? 
Not done within sundhed.dk, but some included 
sources are aggregated (e.g., registries) 


Is the data structured? 
Varies; yes and no 


Who collects the data? Is the data checked or cleaned? 
The GP or specialist's The data is displayed as close to source data as 


office, in the hospital possible, often without correction 
patient administrative 


system (PAS), and 
hospital electronic 
health record system 


Is the data linkable? 
Yes, data can be linked to Central Person Register 


Data collection 
Data linkage 
and cleaning 


Where is the data located? Who owns the data? 
Stored locally at the health Depends on the type of data. Systemic health data is 


care providers. Access is usually owned by the organization generating the data. 
managed via The Danish Data from GPs are submitted to the Danish Quality Unit of 
Healthcare Data Network General Practice, who makes it accessible to patients via 
operated by MedCom Sundhed.dk. Hospital data is transferred to the E-Record 
(repository) database 


How long is the data stored? Who performs the data linkage? é 
No restrictions on data N/A 


storage periods Who has access to data? ee 
All patients and health care providers 


Data storage 


What is the process for acquiring access? How is the data used for 
Sundhed.dk is not accessible for research directly research purposes? 
though the portal, but the data can be used for Sundhed.dk is not used for 
research by permission from the relevant organization research purposes 


How long does it take to become available? 
N/A 
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RKKP 


Denmark 


Improving quality and research utilization of Danish clinical registers 


Data content 


RKKP includes 90 different databases. Coverage of each database varies and they C) /\ 
use different indicators. The databases hold information and variables that among 


5) laboratory results, 6) rehabilitation, 7) patient-reported outcomes (PRO) data, and 


other things cover 1) clinical data, 2) assessments of diagnosis, 3) treatment, 4) medications, f= 


8) sociodemographic data 


Is the data structured? 
Yes 


Who collects the data? 
Clinicians collect data. 
Other data is collected 
through other registries 
(e.g. the national 
clinical registries) 


Data collection 
Data linkage 
and cleaning 


Where is the data located? 
Region Central Jutland 
(Midtjylland) is responsible 
for data storage 


How long is the data stored? 
Central Jutland will delete 
personal information that is 
not needed for further 
processing 
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At what level is the data aggregated? 
Individual level data is aggregated on 
department, hospital, regional and national level 


Isthe data checked or cleaned? 

Yes, RKKP is obliged to supply feedback monthly/ 
quarterly, and produces an annual analytic report 
with recommendations per database 


Is the data linkable? 
Yes, data is linkable to the Central Person Register 


Who owns the data? 

RKKP is exempt from patient consent to data collection. 
Central Jutland is the responsible institution 

Who performs the data linkage? 

RKKP 

Who has access to data? 

Researchers and health care providers have general 
access. Clinicians have access to individual-level o 
data for patients treated in their unit. Others 

have access to aggregated data on sundhed.dk ee 


What is the process for acquiring access? How is the data used for 
Researchers must submit an application to RKKP to research purposes? 

access the registers. For the access to anonymized Data is used to develop and 
individual-level data, researchers need to be affiliated analyze quality indicators. In 
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access to monthly updated data 


remote online databases. RKKP also provides 


with an authorized Danish research environment regional and national audits, 


clinicians determine 


How long does it take to become available? indicators and standards for 
The data is available to researchers no later than 3 good clinical quality, and 


month after a completed application via EY report recommendations 


back to clinical personnel 
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Finland (FIN) 
Population 5,518,050 1 
Administrative structure Parliamentary republic; unitary state organized on a decentralized basis, 2 
of country with central, regional and local levels of governance. 
Jurisdiction of health The health system has a highly decentralized administration, 3 
policy multiple funding sources, and three separate channels for delivering 
services in first-contact care. The role of the state is to oversee and steer 
the system’s functioning through legislation, decrees and the provision 
of information and the core health system is organized by the municipal- 
ities. 
Current health expendi- e 9.2% of GDP 4 
ture (CHE) and per capita e 4,558.5 USS PPP 
health expenditure 
Share of spending paid 17.4% 4 
out-of-pocket (OOP) at 
point of use ( % CHE) 
Type of health insurance | Healthcare financing in FIN is a combination of public financing, statuto- 3 
and main sources of ry health insurance (SHI) and private sources. 
financing (taxation; stat- | Municipal healthcare and statutory national health insurance (NHI): 
utory contributions; Funding for healthcare comes through state-raised and municipal taxes, 
private/voluntary health | as well as the statutory NHI scheme. The NHI scheme is financed by 
insurance premiums; state transfers and compulsory income-based insurance fees from 
OOP; etc.) employers and employees. 
Voluntary, private health insurance (VHI): There are two types of VHI in 
FIN: (1) complementary, which covers NHI user charges and (2) supple- 
mentary, which ensures more choice and faster access to municipal 
healthcare. 
Occupational healthcare: Employers are responsible for organizing 
health services for employees, and NHI covers about half of employers’ 
costs. 
OOP payments: OOP costs come from inpatient hospital care cost- 
sharing and some user fees for municipal services and private services as 
NHI reimbursement levels have not kept pace with actual service fees. 
Extent of coverage by NHI: The NHI provides universal healthcare for all permanent residents. 3 
insurance type Municipal health services: These services are available to all residents in 
a respective municipality. 
VHI: Altogether about 15 % of the population has some type of VHI. 
Occupational healthcare: Employees are covered by occupational 
health care, the scope of which varies (about 33 % of total population). 
Organization of health 
service delivery 
Primary care - gate- Yes; patients can choose where to receive specialist services with a 3 
keeper function? referral from a GP. 
Specialist outpatient Hospital districts (20) are responsible for specialized care. Specialized 3 
care care, both out- and inpatient, is provided by five different organizations 
(four are owned by hospital districts and one by one or more municipali- 
ty): (1) Five university hospitals; (2) central hospitals; (3) university clinic 
departments; (4) psychiatric inpatient facilities; and (5) specialist-run 
health center hospitals (14). Private clinics can also offer services. 
Payment mechanisms | Hospital and specialist care: Hospital districts providing inpatient and 3 


specialist care are mainly funded by the municipalities they are made of. 
Funding most comes from a fixed part based on population and a part 
based on services used. Hospital districts use DRGs for invoicing and 
have a funding pool to cover high individual patient expenses. 
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Physicians in hospital districts are salaried employees, though many 
may work in private clinics on a fee-for-service basis. 


Primary care: Municipalities prospectively fund budget for health cen- 
ters; costs usually determined by previous years’ budgets. In centers run 
by joint-municipal health authorities, budgets are developed similarly, 
but costs are determined by volume of services provided. GPs working 
in municipal centers have variable salary scheme, including monthly 
salary with some extra fee-for-service for selective services. In centers 
where a “personal doctor system” has been introduced, payment is via 
basic salary, capitation and fee-for-service for visits. 


Occupation health services: These are paid by employers using a range 
of methods, including partial reimbursement by NHI (50-60 %). 


Examples of health data e The Act on Secondary Use of Health and Social Data 201 5,6,7 
protection laws e The Data Protection Act 2018 
Example of health data e The Health-Sector Growth Strategy for Research 8,9, 
strategies e eHealth and eSocial Strategy 2020 10 
Index of technical infra- FIN has a strong health information system, with high data availability, 11 
structure though it is less frequently used for reporting on system performance 
and care quality (OECD’s Key national dataset availability, maturity and 
use score: 5.47/7.0). 
Relevant actors Finnish Institute for Health and Welfare (THL; Terveyden ja hyvinvoin- | 2 8, 9, 
nin laitos): Responsible for studying, monitoring and developing 10, 12 


measures of health and well-being, as well as providing information for 
various actors based on research and register data. 


The Social Insurance Institution (Kela; Kansaneläkelaitos): a govern- 
ment agency responsible for settling benefits under national social secu- 
rity programs, including retirement pay, child benefits, unemployment 
benefits, sickness benefits, health insurance and student financial aid. 
As such, Kela’s statistics provide information about the Finnish social 
security system. The statistics aid the development of and research on 
the social security system 


Kanta Services: Finland’s e-health records system serving as one reposi- 
tory for all health-related data. In the future, Findata will be able to 
sample data directly from Kanta Services rather than going to each indi- 
vidual data controller. Kanta Services is maintained by Kela. 


Statistics Finland (Tilastokeskus): A large amount of socioeconomic 
data available through this institution. 


Findata: The new data permit authority overseeing data regulation. It is 
the single-point contact for permits to access several different data- 
bases. It safeguards secure and efficient procedures in utilizing the data 
in research, development and innovation and works in collaboration 
with the THL, but separately from the Institute's other activities. 


Additional controllers providing access to data specified through Act on 
Secondary Use of Health and Social Data include: 


e Social and health care operating units 

e Finnish Centre for Pensions (ETK; Eläketurvakeskus) 

e The National Supervisory Authority for Welfare and Health (Valvi- 
ra; Sosiaali- ja terveysalan lupa- ja valvontavirasto) 

e Finnish Medicines Agency (Fimea) 

e Regional State administrative agencies 

e Vdaestorekisterikeskus (VRK; Population Register Centre) 

e Työterveyslaitos (TTL; Finnish Institute of Occupational Health) 
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Findata 


New data permit authority oversees data regulation under the Act on the Secondary Use of Health and 
Social Data. It is the single-point of contact for permits to access multiple databases and ensures secure 
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and efficient procedures for data utilization in research, development and innovation. 


Data content C) A 


patient systems in primary care, specialist care and social services 


National social and healthcare registers, data from operational client and C] 


Data collection 


Data storage 
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At what level is the data aggregated? 
Will be aggregated at national level, but also 
available for mulitple levels of jurisdictions 


Is the data structured? 
Yes (presumed) 


Is the data checked or cleaned? 
Who collects the data? N/A 
Government agencies 
and collaborative 


health system services 


Is the data linkable? 

Datasets will be made available without 
individual’s direct identifying data. Unclear what 
methods will be used. 


Data linkage 
and cleaning 


Who owns the data? 

Where is the data located? Patients ultimately own their data, but until 2020 each 

At the new national Social data owner controls access to data for secondary use. 

and Health Data Permit From 2020, Findata will control access and release of data 
Authority Findata for secondary purposes 

Who performs the data linkage? 

Findata will see to anonymisation centrally 

How long is the data stored? Who has access to data? 

N/A Access to aggregated data can be provided 6 


for all purposes specified in the Act on the aaa 
Secondary Use of Health and Social Data 


What is the process for acquiring access? How is the data used for 
Free access to aggregate data will be subject to an research purposes? 
information request. A data utilisation plan is required Datasets from data owners, 
for access to data sets. Users can be granted access to including Kanta Services and 
anonymised or pseudonymised data via secured registries, is already used 
remote access system for a prefixed period. Access via extensively for research. 
remote access system will be possible for all other 

purposes referred to in the Act, except for 

development and innovation. 

How long does it take to become available? EY) 


N/A 


Canada (CAN) 


Canada 


Population 36,290,000 1 
Administrative structure Federal parliamentary democracy (Parliament of Canada) under a consti- 2,3 
of country tutional monarchy, where authorities and responsibilities are divided 
between federal government and provincial governments 
Jurisdiction of health Jurisdiction over healthcare governance and provision lies primarily with 3,4 
policy the individual provinces and territories. 
Current health expendi- e 10,8% of GDP 5 
ture (CHE) and per capita e 5,370.4 USS PPP 
health expenditure 
Share of spending paid 14,9% 5 
out-of-pocket (OOP) at 
point of use ( % CHE) 
Type of health insurance Healthcare financing in CAN is a mostly a combination of taxation and 3,4 
and main sources of fi- private sources. 
nancing (taxation; statu- | public insurance program: CAN has a regionally administered universal 
tory contributions; pri- public insurance program, called ‘medicare’. Provinces/territories (P/T) 
vate/voluntary health are most responsible for financing largely private provision; federal gov- 
insurance premiums; ernment transfers funding. The main source of financing is general taxa- 
OOP; etc.) tion at all government levels, e.g., income taxes, consumption taxes, 
corporation taxes and some resource royalties. General tax revenues are 
supplemented by health premiums in three provinces: British Columbia 
(BC), Ontario and Quebec. 
Private health insurance (PHI): Most private health insurance is em- 
ployment-based and compulsory. Employees are required to take it on 
as part of their remuneration and benefits package. PHI covers non- 
medicare sectors and is paid by employers, unions or other organizations 
under group- or uninsured contract. 
OOP payments: OOP costs form the main source of funding for vision 
care, over-the-counter medicines and complementary and alternative 
medicines. 
Other: Other funding sources include voluntary and charitable dona- 
tions; social insurance comprises the largest share, paid by employers, to 
cover workplace injuries and ailments. 
Extent of coverage by Medicare: Medicare is a decentralized, universal healthcare system, 3,4 
insurance type providing 100 % of residents with “medically necessary” hospital, diag- 
nostics and medical services. 
PHI: About 66 % of Canadians purchase PHI to cover services excluded 
from public reimbursement. 
Organization of health 
service delivery 
Primary care - gate- Yes; many provinces pay lower fees to specialists for non-referred con- 3,4 
keeper function sultations. 
Specialist outpatient Hospitals provide the majority of specialist care; private, non-hospital 3,4 
care facilities are also involved in specialist outpatient care provision. 
Payment mechanisms 3,4, 6 


Primary care: Most physicians are self-employed and paid fee-for- 
service across Canada’s provinces/territories; however, there has been 
movement towards alternative payment methods, e.g., capitation, 
blended (salary and fee) payments, incentive-based bonuses, pay-for- 
performance, group-based profit sharing and fundholding systems in 
various jurisdictions. P/T ministries of Health negotiate fee schedules. 


Specialist care: Specialists are mostly financed through fee-for-service, 
though there is some use of global budgets. Specialists have the same 
fee schedule as primary care physicians. 
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Hospital care: Hospital ownership is a mix of public and private, mostly 
managed by regional or community authorities. Hospitals are mostly 
financed by global budgets made on the basis of the previous year’s 
allocation adjusted for inflation and budget growth. Physicians working 
in hospitals are paid fee-for-service. 

Other: Mental health care occurs in specialty and general hospitals as 
well as in outpatient settings. Psychologists are paid OOP or through PHI, 
or under salary with publicly funded organizations. 


Examples of health data e Privacy Act 1985 7,8 
protection laws e Personal Information Protection and Electronic Documents Act 
(PIPEDA) (2000) 
e Health information Act (Alberta) 
e E-Health Personal Health Information Access and Protection of 
Privacy Act (British Columbia) 
e Personal Health Information Act (PHIA) (Manitoba) 
e Personal Health Information Privacy and Access Act (New Bruns- 
wick) 
e Personal Health Information Act and Pharmacy Network Regula- 
tions (Newfoundland and Labrador) 
e Health Information Act (Northwest Territories) 
e Personal Health Information Act (Nova Scotia) 
e Access to Information and Protection of Privacy Act (Nunavut) 
e Personal Health Information Act (Ontario) 
e Health Information Act (Prince Edward Island) 
e An Act to amend the Act respecting health services and social ser- 
vices (Quebec) 
e Health Information Protection Act (Saskatchewan) 
e Health Information Privacy and Management Act (Yukon) 
Example of health data N/A 
strategies 
Index of technical infra- CAN has a limited health information system, with medium coverage 9 
structure (60 % of datasets cover 80 % or more of population) and strong use of 
data to report on care quality and system performance (OECD’s Key 
national dataset availability, maturity and use score: 5.14/7.0) 
Relevant actors Federal and provincial government agencies 10, 
Manitoba Health Information Management Unit: Ensures that data a 


infrastructure, standards and policies are in place to support the appro- 
priate collection, management, use and disclosure of health information 
in accordance with PHIA. 


Population Data BC (PopData BC): A multi-university, data and educa- 
tion resource facilitating research on the human health, well-being, and 
development via access to individual-level, de-identified longitudinal 
data on BC’s residents. 


Statistics Canada: The federal government agency responsible for pro- 
ducing statistics on CAN’s population, including on the economy, society 
and health. 


Statistics Canada Social Data Linkage Environment (SDLE): At Statistics 
Canada; supports the innovative use of administrative and survey data, 
e.g., record linkage, for research and to inform socio-economic policy. 
ICES Linked Data (ICES): A not-for-profit research institute that compris- 
es a community of research, data and clinical experts and a secure and 
accessible array of health-related data in Ontario. 
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List of Sources: 


[1] 
[2] 


[3] 
[4] 


[5] 
[6] 
[7] 
[8] 
[9] 
[10] 


[11] 
[12] 


[13] 
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factbook/countries/ 

Marchildon, G. P. (2013). Canada health system review. Health systems in transition, 15(1). Retrieved 
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sight. Retrieved at: https://www.priv.gc.ca/en/about-the-opc/what-we-do/provincial-and-territorial- 
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ies, OECD Publishing, Paris. https://doi.org/10.1787/9789264244566-en 
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cess to health administrative data with ICES Data & Analytic Services. Healthcare Quarterly, 19(1). 
Population Data BC. (2019). About PopData. Retrieved from: https://www.popdata.bc.ca/aboutus 
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SDLE 


SDLE facilitates research across Canada by: filling data gaps related financial, social, 
economic and general activities and conditions; reducing the burden of having to collect 
new data for different projects; and improving efficiency in data linkage and processing 


Data content 
The SDLE has 2 major components: the Derived Record Depository (DRD) and the Key C) 


Registry. The DRD is a national-level database with personal identifiers. A 
Data content includes 1) tax files, 2) birth and death records, 3) social insurance records, 

4) socio-demographic-economic information (including immigration). 

Linkable datasets include data about 5) individual health, 6) health care use, 7) health 

care encounters and ICD codes, 8) environmental data, and 9) provincial datasets 


At what level is the data aggregated? 
The SDLE links existing datasets, so the data is not 


Is the data structured? 


Yes 
aggregated until used by a researcher 
= 
ke Who collects the data? = Is the data checked or cleaned? 
+ The DRD database is u scat : 
O A ee) = Statistics Canada researchers are responsible for 
a sourced from Statistics = minimizing false positives in data linkages 
5 Canada index files. c 5 
= Linked datasets may be =m x | Isthe data linkable? 
1S collected by other S ==) Yes, the source index files are linked by both 
A agencies A = unique and non-unique personal identifiers 
Who owns the data? 
Whereis the data located? Statistics Canada owns some of the datasets, with linked 
A secure environment at SDLE datasets from external research 
Statistics Canada Who performs the data linkage? 


Statistics Canada employees perform linkage 

Who has access to data? 

Some employees cannot access the source data files, and 

How long is the data stored? have access to only the personal identifiers required 

Data is stored indefinitely for linkage. Other employees only have access to @ 
the source data files and cannot see a 

personal identifiers 


Data storage 


What is the process for acquiring access? How is the data used for 
Researchers can apply to access already linked records research purposes? 

through Statistics Canada's (StatsCan) Research Data The SDLE has been used to 
Centers (RDCs) with the steps: (1) draft a project link many surveys and 
proposal, (2) complete an online form, (3) StatsCan datasets. StatsCan does not 
evaluation of the proposal, (4) complete a security provide a full list of projects 
screening form, (5) sign a microdata research contract, that have used the SDLE, but 
and (6) submit the research output to StatsCan they do have a complete 


record of all projects that 
How long does it take to become available? EN have been approved for 


It depends on the dataset microdata linkages 
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PopData BC 


Canada 


Facilitates research into the determinants of health, well-being, and development from an 
inter-disciplinary perspective 


Data content 

PopData BC manages 21 datasets from federal and provincial sources. External O) A 
also have the option of linking their own datasets to PopData BC. Datasets include 

Information about 1) health care usage, 2) health service usage, 3) vital statistics, 

4) socio-economic-demographic data, 5) income data, 6) occupational safety data, | | 


7) educational data 


Data collection 
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Is the data structured? 
Yes 


Who collects the data? 
Data is collected from 
federal and provincial 
sources 


Data linkage 
and cleaning 


Where is the data located? 
A PopData BC Secure 
Research Environment (SRE), 
a central server accessible by 
an encrypted VPN firewall 


How long is the data stored? 
Archived in accordance with 
a project's protocol once the 
project is complete 


At what level is the data aggregated? 
Some of the data is aggregated (e.g., regional 
income data), but most stored at individual level 


Is the data checked or cleaned? 
Not for projects, but PopData BC validates and 
cleans new datasets to prepare them for linkage 


Is the data linkable? 
Yes, it is facilitated through a "population 
directory" table with personal identifiers 


Who owns the data? 

The data providers, or trustees, who choose to provide 
their data to PopData BC to facilitate access to researchers 
Who performs the data linkage? 

PopData BC performs the linkage through a series of 
deterministic and probabilistic matching techniques. In 
cases where a match is uncertain, a PopData BC 
programmer will make final resolutions 

Who has access to data? ® 


Eligible public researchers based in aa 
Canada may apply to access specific datasets 


What is the process for acquiring access? How is the data used for 
Acquiring access follows a three-step process: research purposes? 
Submit data access and request form to PopData PopData BC does not have 


BC's Data Access Unit (DAU) 


any research activity of its 


. The DAU and the researcher work to achieve own — most completed by 
approval from the data stewards University researchers to 
Researchers sign agreements, undergo privacy publish in academic journals 
training and set up their working environment or inform policy 

How long does it take to become available? EY development. Many data 


Generally, 4-10 months before year end, then 


date back to 1985 


it takes up to 3 months to link and validate 
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Manitoba Population Research Data Repository 
(a project at the Manitoba Centre for Health Policy (MCHP) at the University of Manitoba) 


MCHP conducts population-based health research with the end goal of informing health and 
social policy, resource allocation decisions, and improving health equity in Manitoba 


Data content 

Data in the repository comes froma variety of federal and provincial government 
department administrative datasets, including data on: 1) health care usage, 2) education, 
3) justice, 4) social and family data, and 5) various provincial registries. There are also other 
datasets from regional authorities with 6) health services usage and 7) federal census data 


At what level is the data aggregated? 


Is the data structured? f 
Data may be aggregated when sharing results 


= with un-accredited analysts and researchers 
= 
= Who collects the data? uv oo Is the data checked or cleaned? l 
7 A variety of sources 00 = Yes, MCHP is responsible for conducting checks 
= including federal and X = before datasets are made available 
9 government agencies, = a) 
© local health authorities, o Y Is the data linkable? 
t and indigenous groups 5 = Yes, it is linkable using crosswalk files 
a a 
Who owns the data? 
Where is the data located? The data is not owned by the MCHP, but rather MCHP is 
The data is housed at MCHP able to access the data through a collection of data 
facilities at the University of sharing agreements 
Manitoba Who performs the data linkage? 
N/A 


Who has access to data? 

Accredited individuals who must renew accreditation 

. every year. Once a project has been identified and ® 

completion of a program approved, analysis can be completed aa 
either by an MCHP or external analyst 


How long is the data stored? 
7 years following the 


Data storage 


What is the process for acquiring access? How is the data used for 

Acquiring access follows a three-step process: research purposes? 

1. Complete research proposal and associated forms, Extensively used by the 

2. Obtain research approval MCHP for deliverables and 

3. Draw up a MCHP-researcher agreement and reports, having a significant 
initiate project impact on Manitoba's health 

policy. Over 500 papers have 

How long does it take to become available? been published by MCHP and 

Some of the records available on the data external researchers using 

registry date back to 1970. All data are EY) this linked data 

uploaded after year-end files have closed 
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ICES 


ICES linked data is a way to provide information about continuity of care in order to support 
health system policy, planning, and evaluation in Ontario 


Data content 
The ICES data repository houses information about 1) individual health care, 2) health C) A 


care use, 3) socio-demographic-economic information, 4) registry data (e.g., cancer), 
with the assertion that the repository is “linkable across all data”. | | 


ICES produces a yearly linkability report in order to demonstrate greater transparency 
to researchers who wish to know more about the quality and reliability of their linkage activities 


At what level is the data aggregated? 
Depends on the level of access given to 
researchers 


Is the data structured? 
Yes 


Is the data checked or cleaned? 
Statistics Canada researchers are responsible for 
minimizing false positives in data linkages 


Who collects the data? 
Various groups; ICES 
repositories hold data 
from a variety of 
different administrative 
levels 


Is the data linkable? 
Yes, each person is assigned an ICES key number, 
so their data linkable across the other datasets 


Data collection 
Data linkage 
and cleaning 


Who owns the data? 

ICES is a “prescribed entity”, which grants it rights as a 
data custodian. Data ownership considered case-by-case 
Who performs the data linkage? 

ICES researchers manually implement the probabilistic 
matching methods used to link datasets, which allows for 
the possibility of human error in linkage efforts 

Who has access to data? 

ICES researchers, public sector researchers, who ® 
apply through ICES, and private sector 2.7 
(only analytic services, not datasets) 


Where is the data located? 
Servers at the Sunnybrook 
Health Sciences Center in 
Toronto within a closed- 
computing system 


How long is the data stored? 
Data is stored indefinitely 


Data storage 


What is the process for acquiring access? How is the data used for 
Non-ICES researchers must apply for access and research purposes? 
provide information about the intended use of the Various projects have already 
data. The datasets delivered to researchers are linked, been completed through 
with identifying information removed internal ICES, private and 

public sector researchers. 
How long does it take to become available? ICES researchers routinely 
Datasets are updated with varying frequencies and publish reports using the 
there may be a lag before a researcher is able linked datasets to inform 
to access a dataset due to costs and spero EY Y health policy planning 
Many of the datasets date back to 1991 
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New Zealand (NZL) 


New Zealand 


Population 4,885,500 1 
Administrative structure | Parliamentary democracy under a constitutional monarchy 2 
of country 
Jurisdiction of health The national government plays a central role in determining the 3 
policy healthcare policy agenda, service requirements and budget. The govern- 
ment dominates all aspects of health care as the primary funder and sup- 
plier of healthcare; it also sets regulations and monitors compliance. Dis- 
trict health boards are responsible for planning, purchasing, and providing 
health services and disability support for those over age 65. 
Current health expendi- e 9.1% of GDP 4 
ture (CHE) and per capi- e 4,211.9 USS PPP 
ta health expenditure 
Share of spending paid 12.9 % (2018) 4 
out-of-pocket (OOP) at 
point of use ( % CHE) 
Type of health insur- Healthcare financing in NZL primarily comes from public, government 3 
ance and main sources funding, though PHI and OOP payments also play a role. 
of financing (taxation; National health care system: The national healthcare system in NZL is 
statutory contributions; | financed through general tax revenue. 
private/volintary . Voluntary, private health insurance (VHI): VHI is offered by both not-for 
health insurance premi- : Re HER es E ; 
ums; OOP; etc.) and for-profit organizations and is financed by individuals. It is mainly 
purchased to cover cost-sharing, specialist fees and elective surgery in 
private hospitals (complementary). There is also supplementary coverage 
for faster access to non-urgent treatments. 
OOP payments: OOP costs include cost-sharing and other direct costs, 
such as copayments for general practitioner (GP) visits and pharmaceuti- 
cals. There are reduced fees after 12 doctor visits and no drug copayments 
after 20 prescriptions annually. 
Extent of coverage by Public health care system: NZL’s public health care system provides uni- 3 
insurance type versal health care for all permanent residents. 
VHI: About 33 % of the population purchases some form of VHI. 
Organization of health 
service delivery 
Primary care - gate- | Yes 3 
keeper function? 
Specialist outpa- Most specialists are employed by district health boards (DHB) and work in 3 
tient care public hospitals; however, special care is also provided in private clinics 
and hospitals. 
Payment mecha- Hospital care: There is a mix of private and public hospitals in NZL. Public 3 


nisms 


hospitals receive global budgets from the DHBs (the owners), which is 
derived from past utilization patters, projection of population needs and 
government goals. Budget includes staffing costs. A case-mix funding 
system is used to allocate budget within a DHB hospital. 


Primary care: GPs are mostly self-employed and independent. Half their 
income is based on capitation through a government subsidy paid via 
primary health organizations (PHOs); the other half from patient copay- 
ments for fee-for-service set by individual GPs. PHOs themselves also 
receive per-capita funding to improve access and promote health and care 
coordination. They may receive and provide additional funding to GPs who 
reach particular quality/performance targets for chronic care. 

Specialist care: Specialists employed by DHBs are salaried for work in 
public hospitals; when specialists work privately or treat patients in private 
hospitals payment is fee-for-service. 
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Examples of health data e Privacy Act 1993 5,6 


protection laws e Privacy Act 2020 


e Health Information Privacy Code 1994 

e Health Information Privacy Code 2020 

e Health Record Standard NZS 8153:2002 

e Health (Retention of Health Information) Regulations 1996 
e Public Records Act 2005 

e Health Information Security Framework 2015 

e Te Tiriti o Waitangi (Treaty of Waitangi) 


Example of health data e NZ Digital Health Strategy 7 
strategies 

Index of technical infra- | NZL has a strong health information system and reports great data sharing 8 
structure and accessibility (OECD’s Key national dataset availability, maturity and 


use score: 5.35/7.0). 


Relevant actors NZ Ministry of Health: leads NZL’s health and disability system and is re- 3,9 


sponsible for the management and development of the system, and for 
collecting health and disability information. 


Stats NZ Tatauranga Aotearoa (Stats NZ): the official data agency; oper- 
ates independently of government and is responsible for the collection of 
statistics related to the economy, population and society of NZL. Stats NZ 
curates the Integrated Data Infrastructure (IDI), a large research data- 
base. 


List of Sources: 


[1] 
[2] 
[3] 


[4] 
[5] 
[6] 
[7] 


[8] 
[9] 
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New Zealand 


IDI 


The IDI is a large research database providing evidence-based insights into the society, 
economy, and effectiveness of government initiatives in New Zealand 


Data content 
The IDI contains micro data about people and households in New Zealand. 


Data is longitudinal, probabilistically linked, and de-identified. 
The data includes accident compensation, crime, education, health, medical, 
social welfare, tax data, and others 


Isthe data structured? At what level is the data aggregated? 
Yes Many datasets in the IDI have national coverage 


Is the data checked or cleaned? 
Yes, both ‘probabilistic’ and ‘deterministic’ linking 
methods are used, assisted by linking software 


Who collects the data? 
Government agencies, 
Stats NZ surveys, and 
non-governmental 
organizations (NGOs) 


Is the data linkable? 
There is no common linking variable to match 
individuals across different data sources in the IDI 


Data collection 
Data linkage 
and cleaning 


Where is the data located? Who owns the data? 

Microdata from IDI can only Stats NZ 

be accessed in a secure Data Who performs the data linkage? 

Lab environment Stats NZ 

Who has access to data? 

Researchers can apply to access micro data for research, 
but Stats NZ only provides access to the datasets @ 


How long is the data stored? 
The IDI contains over 166 


Eulen data paints, andis that are relevant to the research project 


growing. Some birth records 
date back to the 1840's dm 
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What is the process for acquiring access? How is the data used for 
Researcher submits request-> Stats NZ decides on research purposes? 
applications with inputs from internal teams -> If Used by analysts and 
approved, researchers can access the secure data lab researchers in the public 
environment where they can perform and submit their sector, universities and NGOs 
analysis outputs for approval-> Only after final to improve outcomes in New 
approval the data gets out of secure environment Zealand. For example, by 
using health and social data 
How long does it take to become available? to produce evidence to 
Estimated to take up to 6 weeks EN improve health outcomes 


® 
104) 
= 
25 
o 
= 
© 
(0) 
un 
eb) 
co 


107 


The Netherlands 


The Netherlands (NLD) 


Population 17,231,017 1 
Administrative struc- Parliamentary constitutional democracy 2 
ture of country 
Jurisdiction of health A tradition of self-regulation, private provision of services and financing via a 3,4 
policy system of social health insurance created a healthcare sector that is domi- 
nated by many mutually dependent actors with different backgrounds. The 
government still has an important role in health policy development and 
implementation, but there are many actors involved, with only limited op- 
portunities for the government to act autonomously. 
Current health ex- e 10.2% of GDP 5 
penditure (CHE) and e 5,739.2 USSPPP 
per capita health ex- 
penditure 
Share of spending paid | 10.6 % 5 
out-of-pocket (OOP) at 
point of use ( % CHE) 
Type of health insur- Healthcare financing in NLD is mixed and includes government funding, stat- 3,4 
ance and main sources | utory contributions and a combination of private and other sources. 
of financing (taxation; | statutory health insurance (SHI): SHI is financed through a nationally de- 
statutory contribu- fined, income-related contribution, government grant for the insured below 
tions; pri- age 18, and community-rated insurance premiums. The NLD government 
vate/voluntary health partially finances SHI through subsidies from general taxation and realloca- 
insurance premiums; tion of payroll levies among insurers. It is provided through private insurers. 
POR Et Voluntary, private health insurance (VHI): VHI provide statutory and non- 
statutory benefits and complementary VHI covers cost-sharing for medicines 
and services excluded from the statutory package, e.g., dental care, alterna- 
tive medicine, eyeglasses, physiotherapy. Premiums for VHI are not regulat- 
ed. 
OOP payments: Since 2016, every insured must pay an annual deductible for 
healthcare costs. Besides this, OOP costs include cost-sharing of some ser- 
vices. 
Extent of coverage by SHI: In the publicly financed health insurance system there is near universal 3,4 
insurance type health coverage, with all residents and nonresidents who pay income tax 
mandated to purchase SHI (from private insurers). 99.8 % of population is 
insured. 
VHI: 84 % of the population purchases some combination of complementary 
VHI. 
Organization of health 
service delivery 
Primary care - Yes; referral by a GP is required for hospital and specialist care. 3,4 
gatekeeper func- 
tion? 
Specialist outpa- Almost all specialists are hospital-based; there is a growing trend to work in 3,4 
tient care multidisciplinary ambulatory centers. NLD has six types of institutions that 
provide specialist care: General hospitals; academic (university) hospitals; 
specialized hospitals; independent treatment centers (day care only); top 
clinical centers (both general hospital care and complex care); and trauma 
centers. 
Payment mecha- Hospital care: Most hospitals are private, nonprofit and are paid through 3,4 


nisms 


case-based per diem payments, negotiated with insurer over price, quality 
and volume, using the case-based diagnosis-treatment combination system 
(DBCs). Fee-for-service is also used. 


Primary care: GPs mainly work independently or in a self-employed partner- 
ship. There are three paths for GP financing: (1) “Core primary services” are 
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paid through capitation fees per registered patient and consultation fees for 
GPs and ambulatory mental health care; the Dutch Health Care Authority 
sets fees; (2) Programmatic, multidisciplinary care is funded for certain 
chronic diseases via bundled payments; prices are negotiated with insurers; 
(3) additional contracts with insurers based on pay-for-performance. 


Specialist care: Within hospitals, specialists are either in group practice, paid 
fee-for-service, or salaried. Specialist fees are freely negotiable as a part of 
hospital payment. Specialists in ambulatory centers are paid fee-for-service; 
the fee schedule is insurer negotiated. 


Other: Long-term residential care is paid through care intensity packages. 


Of note, insurers in NLD are expected to engage in strategic purchasing, and 
contracted providers are expected to compete on both quality and cost. 


Examples of health e EU Regulation 2016/679 (General Data Protection Regulation) 3, 6, 
data protection laws e Personal Data Protection Act 2000 (wet Bescherming per- 7 
soonsgegevens) 

Example of health data | N/A 

strategies 

Index of technical NLD has limited health information systems, reporting higher availability and 8 

infrastructure coding standardization and lower coverage and data linking for research/ 
monitoring (OECD's Key national dataset availability, maturity and use score: 
4.54/7.0). 

Relevant actors Statistics Netherlands (CDS; Centraal Bureau voor de Statistiek): If govern- 2,9, 

10 


ment invests public funds in a dataset, Statistics Netherlands can access it. It 
conducts data linkage project using own data. 


Health Care TTP: This agency leads on other data linkage projects and pro- 
vides access to de-identified data. 


Nivel Primary Care Database (Nivel PC Database; Nivel Zorgregistraties 
Eerste Lijn): uses routinely recorded data from healthcare providers to moni- 
tor health and usage of services in a population representative sample. 


PHARMO Database Network: seeks to gain greater insights of healthcare 
with the collection and analysis of patient-centric data. It provides infor- 
mation of more than 4 million (25 %) residents of a well-defined population 
in the Netherlands for an average of ten years, creating disease-specific 
cohorts which are linkable to perinatal registry and various healthcare data- 
bases. 


Other: Datasets that are not financed by the government belong to different 
owners and access to data can be approved on a project-by-project basis. 
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Nivel Primary Care Database 


‘Research for better care’ is Nivel’s mission statement and also for Nivel’s Primary Care 
Database. This implies research on developments in public health, quality of care and health 
care utilization 


Data content O) A 
Nivel Primary Care Database uses routinely recorded data, such as health problem and 


treatment data, to monitor health and use of health services among the Dutch population | 


through a representative sample of up to 10% of the Dutch population 


At what level is the data aggregated? 
Could be at national, regional, practice, individual 
level and individual consultation 


Isthe data structured? 
Yes; no free text fields 


Isthe data checked or cleaned? 
Yes. Shared responsibility between Nivel and 
applicant 


Who collects the data? 
Nivel collects the data. 
Recording of the data 
takes place in the 
primary care practices 


Is the data linkable? 
Yes, through pseudonyms of a national identifier. 
Linkage with other databases is possible 


Data collection 
Data linkage 
nd cleaning 


Who owns the data? 

Whereis the data located? No organization owns the data, but Nivel has access to it 
Data is stored in data for research purposes 

warehouse located at Nivel Who performs the data linkage? 

A trusted third party performs pseudonymization. Nivel 
performs linkages between data from different disciplines. 


i > 
How long is the data storedi Linkage with external data sources is often via Statistics 


Data are stored ‘forever’. If 


. À Netherlands 
the funding of the project Aae to data? ® 
would stop, data would be Access to data is dependent on conditions ta 
safely stored that have to be fulfilled 


Data storage 


What is the process for acquiring access? How is the data used for 

Researchers contact Nivel using a form available on the research purposes? 

website. Application has to be approved according to Many research projects on 

governance code of Nivel Primary Care Database, in health care use and 

which umbrella organizations of primary care providers population health status 

and a privacy committee play a central role have been completed using 
Nivel data. Applicants can be 

How long does it take to become available? Nivel researchers, but also 


Depends on complexity of the application EY researchers from other 


and possible privacy issues involved institutes 
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PHARMO Database Network 


Rapid access to primary and secondary healthcare data for research purposes 


4 million residents in the Netherlands (25%). It is based on patient information 
retrieved from 1) GPs, 2) hospitals, 3) in-outpatient pharmacies, 4) laboratories 


Data content 
The PHARMO database provides rich and detailed information of more than 
and 5) patient reported outcomes = 


Is the data structured? At what level is the data aggregated? 
Varies; yes and no At the national and regional level 


Is the data checked or cleaned? 
Yes. It is the responsibility of STIZON, but is also 
done on project level by PHARMO 


Who collects the data? 
PHARMO links different 
data sources from GPs, 


y ae I d inkable? 
hospitals, registries etc. ida 


Some data is linked using the unique social 
security number 


Data collection 
Data linkage 
and cleaning 


Whereis the data located? Who owns the data? 
Data is stored on secured Healthcare providers and patients 
servers in the Netherlands Who performs the data linkage? 
Eh STIZON 
© Who has access to data? 
O Data access is granted to PHARMO and INSZO by STIZON. 
i How long is the data stored? Access can be requested by researchers 
fi N/A from universities ® 
oO 
a ms 


What is the process for acquiring access? How is the data used for 
. Researchers have to complete a data request form research purposes? 
which is available on the website of PHARMO PHARMO itself conducts 
. PHARMO request approval from the compliance analyses for insights into the 
committee performance of medicines. 
. Upon approval, the data is readily available Pharmaco-epidemiological 
studies are conducted with 
How long does it take to become available? different stakeholders, 


A few weeks including the pharmaceutical 
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Austria (AUT) 


Austria 


Population 8,847,037 1 
Administrative structure | Federal parliamentary republic 2 
of country 
Jurisdiction of health Responsibilities are shared between the federal and state levels. Some 3,4,5 
policy have been delegated to self-governing bodies. The federal level is prima- 
rily responsible for regulating social insurance and healthcare provision, 
except hospital care. Here, the federal level gives basic guidance while 
the states define the specifics of legislation and implementation. 
Current health expendi- e 10.4% of GDP 6 
ture (CHE) and per capita e 5,705.1 USSPPP 
health expenditure 
Share of spending paid 17.7% 6 
out-of-pocket (OOP) at 
point of use ( % CHE) 
Type of health insurance | Healthcare financing in AUT is mainly financed through a mix of income- 3,4 
and main sources of related statutory health insurance (SHI) contributions, general taxation 
financing (taxation; stat- | and private sources. 
utory contributions; SHI: Contributions are wage-based. Contributions for unemployed and 
private/voluntary health | pensioners are financed through general tax revenues; federal states 
insurance premiums; cover contributions for those on social welfare benefits. 
POR ete] Voluntary, private health insurance (VHI): VHI is offered by the SHI sys- 
tem and is mainly supplementary for (1) cover for extra amenities in the 
hospital sector and (2) cover for more provider choice and medicines in 
ambulatory care. Premiums are risk-based. 
OOP payments: direct payments, user chargers (cost-sharing) and infor- 
mal payments. These have increased in the last decade in terms of abso- 
lute spending. 
Extent of coverage by SHI: there is near universal health coverage, with 99.9 % of the popula- 3,4 
insurance type tion covered. 
VHI: More than 33 % of population is covered by some form of VHI. 
Uninsured: a limited number of people are not insured due to employ- 
ment situations; they can register for VHI. 
Organization of health 3,4 
service delivery 
Primary care - gate- No 3,4 
keeper function 
Specialist outpatient | Specialist outpatient care is provided by office-based doctors, outpatient 3,4 
care clinics and in hospitals. 
Payment mecha- Hospital care (inpatient): Payment for acute services are regulated by 3, 4, 5, 
nisms the national Leistungsorientierte Krankenanstaltenfinanzierung (LKF) 7 


framework by: (1) DRG-based payment system and (2) state-specific 
steering, which includes a fixed-budget. Public hospitals sometimes re- 
ceive a per diem fee for patients with VHI. VHI also covers fee-for- 
service payments for hospital physicians on top of their salaries, with a 
share kept by the hospital. Some specialist departments are paid on a 
per diem basis. 


Hospital care (outpatient): Outpatient hospital services paid via state 
health funds (LGFs). 50 % of payment is based on a DRG-outpatient sys- 
tem; the other 50 % is covered by a fixed-budget component of the LKF 
system. 


Primary care: SHI GPs generate revenue by fee-for-service and capita- 
tions. Non-contracted GPs are paid fee-for-service, setting own fees. 


Specialist care: Ambulatory services are provided by GPs, specialist phy- 
sicians, dentists and outpatient clinics, etc. Payment mechanisms include 
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fee-for-service and capitation, based on whether services are included in 
SHI catalogue of reimbursable services and kind of contract provider has 
with SHI. Otherwise, direct payment is required, reimbursable up to 

80 %. PHI may cover the difference. 


Other: Long-term care institutions are financed by states and local au- 
thorities. 


Examples of health data e EU Regulation 2016/679 (General Data Protection Regulation) 8,9, 
protection laws e The Austrian Data Protection Act 10, 11, 
e The Austrian Health Telematics Act 12 
e The Electronic Health File Act 
e The Hospitals and Sanatoriums Act 
e The Patient Charter 
e The Research Organization Act 
e The Privacy Amendment Act 
Example of health data e Austria Health Targets (since 2011) 13 
strategies 
Index of technical infra- N/A 
structure 
Relevant actors Austrian National Public Health Institute (GOG; Gesundheit Osterreich 3, 4,5, 
GmbH): Responsible for Austrian health information system (ÖGIS; Os- 14, 15 


terreichisches Gesundheitsinformationssystem); the regional health 
information system (REGIS; Regionale Gesundheitsinformationssystem); 
and the health data warehouse (DIAG; Dokumentations- und Informati- 
onssystem für Analysen im Gesundheitswesen). 


Regional social insurance authorities: Submits collected data from 
healthcare providers to the main social insurance federation after recod- 
ing it. 

Main social insurance federation (HVB; Hauptverband der öster- 
reichischen Sozialversicherungsträger): Data received is pseudonymized 
by a designated unit; geographic and structural data is added to individu- 
al datasets. HVB submits the data to the Ministry of Labor, Social Affairs, 
Health and Consumer Protection (Sozialministerium; Bundesministerium 
für Soziales, Gesundheit, Pflege und Konsumentenschutz). 


DIAG: Stores data from the Sozialministerium. 
ÖGIS: main instrument of health reporting and health planning. 


Electronic Health File (ELGA; Elektronische Gesundheitsakte): supports 
treatment with improved availability of information. 


REGIS: part of ÖGIS; provides regional health-related comparisons ac- 
cording to selected indicators. 


Statistics Austria (Statistik Austria): Provides additional data (e.g., basic 
demographic data) from various sub-sources. 


Federal Ministry for Digital and Economic Affairs (BMDW; Bundesminis- 
terium für Digitalisierung und Wirtschaftsstandort): Responsible for legal, 
business and technical guidance. 


The Austrian Federal Computing Center (BRZ; Bundesrechenzentrum): 
Provides assistance with software development and integration, as well 
as data security and protection. 


Federal Ministry of Climate Action, Environment, Energy, Mobility, 
Innovation and Technology (BMK; Bundesministerium für Klimaschutz, 
Umwelt, Energie, Mobilität, Innovation und Technologie): Provides dis- 
tance and travel time data. 
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ELGA 


ELGA supports medical treatment through improved availability of information 


Data content 
ELGA includes individual-level health information such as 1) medication data 


(for prescription as well as non-prescription medications relevant to interaction), 
2) examination results, 3) laboratory tests, and 4) imaging output (further planned: 
patient discharge, precautionary powers of attorney, statutory medical registers) 


At what level is the data aggregated? 


Isthe data structured? Ka 
On demand when an individual or a health 


= service provider accesses patient-level data 
= 
ke) bo Is the data checked or cleaned? 
D Who collects the data? SE = No, there is no authority that checks the data for 
V GPs, hospitals, care RSS) its accuracy and quality 
5 centers other medical c a 
o specialists, dentists and = TS Is the data linkable? 
= pharmacies N Te Yes, data is linked to central patient index 
a A = (Zentraler Patientenindex) 

Who owns the data? 

Whereis the data located? Data ownership lies with the site of data generation 

Data is kept decentralized in (clinic, laboratory, etc.) 

13 ELGA storage units/areas Who performs the data linkage? 
$b N/A 
© How long is the data stored? Who has access to data? 
O The legal period for storing Only the patient and the medical specialist who is 
D medical data is 30 years for currently treating the patient have access to the data 
p inpatient data and 10 years The authorization system (Berechtigungssystem) $ 
A for ambulatory data in the ELGA architecture checks every ae 


access inquiry of health data 


What is the process for acquiring access? How is the data used for 

Access is restricted to the patient and the health research purposes? 

service provider that is currently treating the patient Research use under certain 
conditions is legally allowed. 

How long does it take to become available? However the ELGA 

Ambulatory physicians have access to the digital infrastructure is technically 

medical file for 28 days after treatment was registered, not able to provide data for 

inpatient physicians have access for 28 days after research so far 

hospital discharge, pharmacists can access 

information about medication up to two EN 


hours 
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OGIS 


OGIS is the main instrument of health reporting and health planning 


Data content 

OGIS stores individual level health data such as 1) diagnosis and performance of 

Austrian hospitals ("LKF data“), 2) documentation for the entire outpatient area, C) A 
3) information on patient/mobile care of elderly patients, and 4) long-term care data. 

It also contains aggregated data like 5) causes of death, 6) cancer statistics, 7) hospital 

statistics 8) medical statistics, 9) basic demographic data and small-scale | 


population forecasts, 10) accessibility data and 11) basic socio-economic data 


At what level is the data aggregated? 
Data is aggregated at the national, regional and 
community level 


Is the data structured? 
Yes 


Is the data checked or cleaned? 
Yes, the system software includes plausibility 
checks. Testing is performed quarterly 


Who collects the data? 
Gesundheit Osterreich 
GmbH (GOG) collects 
data from several 
sources and stores data 


Is the data linkable? 
Yes, data is linked to bPK (unique healthcare 
identifier) 


Data collection 
Data linkage 
and cleaning 


Who owns the data? 

Gesundheit Osterreich GmbH (GOG) as an operating body 
is responsible for data storage after receiving data from 
the various sub-sources. Pseudonymized data, 
performance and diagnostic data are linked in the Federal 
How long is the data stored? Ministry of Health and stored in the DIAG 

The legal period for storing Who performs the data linkage? 


Where is the data located? 
Data is stored at the DIAG 


medical data is 30 years for N/A 
inpatient data and 10 years Who has access to data? 


for ambulatory data Access to data is granted after formal request and 
payment of fees 


Data storage 


What is the process for acquiring access? How is the data used for 
After sending a formal request, OGIS charges the research purposes? 
researcher for its evaluation (at least 180 Euro) and Data is used for health 
carries it out as customized as possible according to reporting and systems 
the wishes of the client and taking into account the planning by national 
data protection requirements institutions, as well as 
How long does it take to become available? European cooperations. 
OGIS is updated on yearly basis. Detailed information on 


The time lag for data to be available is individual requesting persons 
nearly one year or institutions is not available 


(0) 
va) 
=j 
ie 
oO 
<= 
© 
(0) 
un 
(eb) 
co 


119 


Austria 


REGIS 


REGIS is part of ÖGIS and provides regional health-related comparisons according to 
selected indicators 


Data content C) A 
REGIS provides aggregated data such as 1) population statistics, 2) causes 


of death statistics, 3) diagnosis and performance documentation of Austrian | 


hospitals, 3) Austrian Health Survey 2006/07 and 4) road accident statistics 


At what level is the data aggregated? 
Evaluations are available at two regional levels: 
94 political districts and 32 supply regions 


Isthe data structured? 
Yes 


Isthe data checked or cleaned? 
The system software includes plausibility checks. 
Testing is performed quarterly 


Who collects the data? 
Data presented in 
REGIS is collected by 
other institutions (e.g. 
Statistics Austria) 


Is the data linkable? 
Yes, data is linked to bPK (unique healthcare 
identifier) 


Data collection 
Data linkage 
and cleaning 


Who owns the data? 

Where is the data located? Gesundheit Osterreich GmbH (GOG) as an operating body 
Data is stored at the DIAG is responsible for data storage after receiving data from 
the various sub-sources. Pseudonymized data, 

. performance and diagnostic data are linked in the Federal 
How long is the data stored? Ministry of Health and stored in the DIAG 

The legal period for storing Who performs the data linkage? 

medical data is 30 years for N/A © 
inpatient data and 10 years Who has access to data? 

for ambulatory data Anyone can access REGIS dm 


Data storage 


What is the process for acquiring access? How is the data used for 
Everyone can access respective representations under research purposes? 
https://regis.goeg.at/. Data and images cannot be Data is used for health 
downloaded or used for further analysis reporting and systems 
planning by national 
How long does it take to become available? institutions, as well as 
Data is updated irregularly, last queries were European cooperations. 
performed in autumn 2015. Individual information on Detailed information on 


available data years are provided individual requesting persons 
with each respective graphic or institutions is not available 
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e-prescription ("e-Rezept") 


(pilot-phase April 2020) 
e-prescription is an e-card application for social security administration system 


Data content 
Statutory health insurance prescriptions are stored as e-prescription. 

Focus is the reduction of paper-based processes by electronically 

recording, redeeming and settling cash receipts. In addition, the 

redeemed recipe fees will be charged daily to the recipe fee account | 
(REGO) of the insured 


Isthe data structured? At what level is the data aggregated? 
Yes Data is not aggregated 


Is the data checked or cleaned? 
Data is checked for completeness. Plausibility 
checks are not planned 


Who collects the data? 
Every attending 
prescribing physician 


i ? 
collects data Is the data linkable? 


Yes, the e-card system processes sensitive, 
personal health data 


Data collection 
Data linkage 
and cleaning 


Where is the data located? Who owns the data? 


Data is stored in two e-card Data ownership lies with the site of data generation 
data centers and is pulled (clinic, laboratory, etc.) 
v together on demand Who performs the data linkage? 
00 N/A 
o How long is the data stored? Who has access to data? 
Q The legal period for storing Every patient has access to their individual 
= medical data is 30 years for e-prescription data under 6 
+4 inpatient data and 10 years www.meinesv.at. Patients grant 
a for ambulatory data access to attending physicians r 


What is the process for acquiring access? How is the data used for 
Access is depending on two-factor principle. The e-card research purposes? 

is the key card of the patient. This "key" gives the e-prescription starts its pilot 
authorized physician access to the claim data. The phase in 2020 and 

admin card is the healthcare provider's entitlement nationwide roll-out is 

card. Only with the e-card of the patient and the admin planned for 2022. So far e- 
cardcan data be accessed in the e-card system prescription data is not used 


for research purposes yet 
How long does it take to become available? EY 
N/A 
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Sweden (SWE) 


Sweden 


Population 10,183,175 1 
Administrative struc- Parliamentary constitutional monarchy 2 
ture of country 
Jurisdiction of health The healthcare system is organized into three levels: the 3 
policy national, regional and local. The Health and Medical Services Act of 
1982 specifies that the responsibility for ensuring access to good health care 
is that of the county councils/regions and municipalities. 
Current health ex- e 10.9% of GDP 4 
penditure (CHE) and e 5,551.9 USS PPP 
per capita health ex- 
penditure 
Share of spending paid | 13.9% 4 
out-of-pocket (OOP) at 
point of use ( % CHE) 
Type of health insur- Healthcare financing in SWE is derived mainly from government funding and 3,5 
ance and main sources | some private sources. 
of financing (taxation; | National healthcare system: the national health insurance (NHI) is financed 
statutory contribu- via general taxes raised by county councils, along with some national tax 
tions; pri- revenue. The system is delivered at the regional level. 
Mate) voluntary mean Voluntary, private health insurance (VHI): VHI is mainly supplementary 
insurance premiums; ae . 
OOP; etc.) coverage from employers for enhanced access to specialists and elective 
treatments. 
OOP payments: OOP costs are contained so a degree through caps on cost- 
sharing for health services (USD123) and drugs (USD246); most OOP spend- 
ing goes to pharmaceuticals. County councils set copayment rates. 
Extent of coverage by NHI: Within the national healthcare system, coverage is universal and auto- 3,5 
insurance type matic for all legal residents. 
VHI: Around 10 % of all employed individuals ages 15-74 have private insur- 
ance. 
Organization of health 
service delivery 
Primary care - No 3 
gatekeeper func- 
tion? 
Specialist outpa- Specialist outpatient care is provided by both public and private providers, 3,5 
tient care including university hospitals, county council hospitals and in private clinics. 
Payment mecha- Hospitals: Hospitals in SWE are mostly public, with some private for-profit 3,5 
nisms and not-for-profit organizations. Payment mechanisms include global budg- 
ets and case-based payment, with limited pay-for-performance. 
Primary care: SWE’s primary care is delivered by both public and private 
providers, who are paid through a mix of, largely, capitation and fee-for- 
service, with even more limited use of performance-related payments. 
Specialist care: Independent of service delivery location, outpatient special- 
ist care is paid through fixed, prospective, per-case payments. These are 
based on DRGs. In addition, there is some use of price/ volume ceilings and 
quality components to compensation. 
Examples of health e EU Regulation 2016/679 (GDPR; General Data Protection Regulation) 
data protection laws e The Public Access to Information and Secrecy Act 6,7 
e The Personal Data Act 
e The Patient Data Act 
e The Data Protection Act 
Example of health National eHealth Strategy 2010 8 


data strategies 
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Sweden 


Index of technical SWE has very high overall data availability, sharing and accessibility, but 9 
infrastructure reports less use of using data to report on quality/performance or for re- 
search/monitoring purposes (OECD’s Key national dataset availability, ma- 
turity and use score: 5.70/7.0). 


Relevant actors National Board of Health and Welfare (Socialstyrelsen): central national 3,5, 
authority for social services, public health, infectious diseases prevention 10, 
and health services. It also maintains health data registers and official statis- 11 
tics. 


Swedish National Patient Portal (Journalen): the Swedish national patient 
accessible EHR system, which is accessible online via the national patient 
portal with an electronic identifier or Swedish personal identity number. 
Journalen was originally piloted as Sustains in the Uppsala region with an 
“internal health account”, 


Registerforskning.se: operated by the Swedish Research Council, provides 
researchers with information on existing registers, as well as support during 
the process of register-based research, e.g., information on each part of the 
process of identifying, requesting and using register data. 

Register Utiliser Tool (RUT): The Swedish Research Council is developing a 
tool for registerforskning.se to facilitate and enable efficient searching and 
matching of information on metadata in registers. 


List of sources: 


[1] The World Bank. (2019). Total population. Retrieved from: 
https://data.worldbank.org/indicator/SP.POP.TOTL?view=chart 

[2] Sweden — The World Factbook. (2019). Retrieved from: https://www.cia.gov/the-world- 
factbook/countries/ 

[3] Anell, A., Glenngärd, A. H. & Merkur, S. (2012). Sweden health system review. Health systems in tran- 
sition, 14(5). Retrieved from: http://www.euro.who.int/__data/assets/pdf_file/0008/164096/e96455.pdf 

[4] OECD Statistics. (2019). Health Expenditure and Financing. Retrieved from: 
https://stats.oecd.org/Index.aspx?DatasetCode=HEALTH_STAT# 

[5] Eds. Mossialos, E., Djordjevic, A., Osborn, R., Sarnak, R. (2017). International Profiles of Health Care 
Systems. The Commonwealth Fund. Retrieved from: 
https://www.commonwealthfund.org/sites/default/files/documents/___media_ files publications fund_r 
eport 2017 _may_mossialos_intl_profiles_v5.pdf 

[6] Kirchberger, C. (2014). Overview of the national laws on electronic health records in the EU Member 
States. National report for Sweden. time.lex/Milieu Ltd. Retrieved from: 
https://ec.europa.eu/health/sites/health/files/ehealth/docs/laws_sweden_en.pdf 

[7] General Data Protection Regulation (GDPR). (2018). General Data Protection Regulation (GDPR) — Fi- 
nal text neatly arranged. Retrieved from: https://gdpr-info.eu 

[8] International Society for Telemedicine & eHealth. Sweden National eHealth Strategy 2010. Retrieved 
from: https://www.isfteh.org/media/sweden_national_echealth_ strategy 2010 

[9] OECD. (2015). Health data governance: Privacy, monitoring and research. OECD Health policy stud- 
ies, OECD Publishing, Paris. https://doi.org/10.1787/9789264244566-en 

[10] Registerforskning.se. (2019). Easier to find register data with the Register Utiliser Tool (RUT). Re- 
trieved from: https://www.registerforskning.se/en/registers-in-sweden/easier-to-find-register-data-with- 
the-register-utiliser-tool/ 

[11] Armstrong, S. (2017). Patient access to health records: striving for the Swedish ideal. The BMJ, 
357:j2069. Retrieved from: https://www.bmj.com/content/357/bmj.j2069 
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Journalen 


Sweden 


Makes health data available for patients, increases quality of care and cost-effectiveness in 
the health care system 


Data collection 
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Data content 
Journalen contains information on patients’ medical records |] 


Isthe data structured? 
Yes 


Who collects the data? 
The health care 
provider 


Data linkage 
and cleaning 


Where is the data located? 
Patient records are kept 
electronically. Most GPs use 
electronic patient records for 
diagnostic data 


How long is the data stored? 
Data is not stored. 
Information is retrieved 
every time a provider or 
patient logs in 


At what level is the data aggregated? 
N/A 


Isthe data checked or cleaned? 
N/A 


Is the data linkable? 
No 


Who owns the data? 

Each health care provider owns their respective journal 
information 

Who performs the data linkage? 

N/A 

Who has access to data? 

Health care providers and ® 


_ individual patients 


What is the process for acquiring access? How is the data used for 
When a health care provider connects to display research purposes? 

journal information, a technical connection to a service Data is not used for research 
platform occurs. This service platform allows the purposes 

sending of structured data, regardless of journal 


systems, to display the same way 
for the provider 


How long does it take to become available? 


N/A 


Y 
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Sweden 


Registerforskning / RUT 


Provides researchers with information on existing registers. RUT is being developed to 
facilitate searching and matching of information among registers 


Data content 

Registerforskning includes several registers availablethrough Swedish national 

public authorities with data covering for example 1) health care, 2) taxes, 3) residency, 
4) civil status, 5) criminal convictions and 6) education. The tool RUT includes only 
metadata, without any micro-data 


Isthe data structured? At what level is the data aggregated? 

Varies; RUT metadata Data is at individual level and is generally linked 

structured before being released in a de-identified format to 
the researchers 


Is the data checked or cleaned? 
N/A 


Is the data linkable? 
Yes, unique personal identity numbers allow for 
data to be linkable at the source 


Who collects the data? 
Government agencies 
or other organizations, 
using various methods 


Data collection 
Data linkage 
and cleaning 


Who owns the data? 

Whereis the data located? Data ownership depends on the type of organization that 
Different register holders are collected the data and is administering it 

responsible for different Who performs the data linkage? 

registers Normally the register holder 

Who has access to data? 

Different registry holders use different systems to make 
data available. The metadata in RUT is modelled 

by the Swedish Research Council in a collaborative S 


aner a. ota process with the register holder before being dm 
project, but variable published 


How long is the data stored? 
As a general rule it should be 
stored for at least 10 years 


Data storage 


What is the process for acquiring access? How is the data used for 
Several regulations define how data from registers can research purposes? 
be processed for research purposes and when RUT helps researchers access 
researchers can obtain data from a register holder. To information on existing 
request register data, researchers need to contact the registers, and offers support 
register holder responsible for the particular register of through the research 
interest, with different processes to disclose data. process. Several publications 
How long does it take to become available? have used register data. RUT 
Most recent data is from 2017, 2018 and supports researchers in how 
2019 EN to link data from different 
sources 
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Republic of Korea 


Republic of Korea (KOR) 


Population 51,635,256 1 
Administrative struc- Presidential republic 2 
ture of country 
Jurisdiction of health Central government and centralized, single insurer with six regional head- 3 
policy quarters. 
Current health ex- e 8.2% of GDP 4 
penditure (CHE) and e 3,406.3 USS PPP 
per capita health ex- 
penditure 
Share of spending paid | 30.2 % 4 
out-of-pocket (OOP) at 
point of use ( % CHE) 
Type of health insur- Healthcare in KOR is financed mainly by a social (national) health insurance 3 
ance and main sources | system (NHIS), though other sources, including private, are also in play. 
of financing (taxation; | NHIS: The NHIS is financed through employment-based social contributions, 
statutory contribu- based on a uniform rate, or other measures of ability to pay. The poorest of 
tions; pri- the population do not pay contributions to NHIS and are managed through 
vate/voluntary health | the Medical Aid Program, financed by the general revenue of the central 
insurance premiums; and local governments but administered (including payments to providers) 
OOP; etc.) through the health insurance system. 
Voluntary, private health insurance (VHI): VHI is available to cover the co- 
payments for insured services and payments for uninsured services. 
OOP payments: OOP spending is high, including for cost-sharing (co- 
payments for covered services) and full payment for services excluded from 
the benefits package. 
Extent of coverage by NHIS: There is near universal health coverage through NHIS (97 % of popula- 3 
insurance type tion). 
Medical Aid Program: The Medical Aid Program covers remaining 3 % of the 
population. 
VHI: About 75 % of the population in KOR purchases VHI. 
Organization of health 
service delivery 
Primary care - gate- No 3 
keeper function? 
Specialist outpatient All general hospitals provide outpatient specialist services; many physicians 3 
care have specialist certifications and practice from their offices as single opera- 
tors. 
Payment mechanisms Hospital care: Hospitals are non-for-profit; payment methods from NHIS 
insurance funds include fee-for-service, DRG-based prospective payments 3 
to acute care providers (for seven disease categories) and per-diem pay- 
ments (for 17 disease categories) to long-term care hospitals. Individual 
physicians are salaried; hospitals sometimes give financial incentive sys- 
tems, based on number and profits. 
Primary care: Healthcare facilities are paid fee-for-service through health 
insurance funds; individual physicians are salaried. Fee-for-service is based 
on the Resource-based Relative Value (RBRVI) system; fees are set by insur- 
ers. 
Specialist care: Healthcare providers are paid fee-for-service, based on fees 
set by insurers based on the RBRVI system; individual physicians are sala- 
ried. 
Examples of health e The Basic Law on Health and Healthcare 3,5, 
data protection laws e The Bioethics and Safety Act 2005 6 


e The Personal Information Protection Act (PIPA) 2011 


Republic of Korea 


e The Rare Disease Management Act 2015 

e The Regulation on the Operation and the Management of the Nation- 
al Biobank of Korea 2013 

e The Cancer Control Act 2003 


Example of health data e The Regulatory “Sand Box” Initiative 7 


strategies e EMR Certification Initiative 


e Big data initiatives such as information linkage between National 
Health Insurance agencies, Centers for Disease Control and Preven- 
tion and hospitals 


Index of technical KOR rates among the highest for health data availability, though less so for 8 
infrastructure accessibility. Data is also not often used for research/monitoring purposes 
(OECD’s Key national dataset availability, maturity and use score: 5.92/7.0). 
Relevant actors Ministry for Health and Welfare: The main tasks of this ministry are over- 3,5, 
sight of healthcare and quarantine, compulsory administration, pharmacist 7 


administration, health insurance, basic living insurance, welfare support, 
social security and social service policies, and population policy to cope with 
low birth rate, aging and child welfare. 


Ministry of Economy and Finance: This ministry oversees the financial poli- 
cies of KOR, including taxation system, management of public institutions 
and planning and coordinating the mid- and long-term economic develop- 
ment goals of the country. 


National Health Insurance (NHIS) and National Health Insurance Database 
(NHIDB): NHIS includes data from all three types of health insurances in the 
Republic of Korea — NHIS, Medical Aid Program, and long-term care as well as 
from several sub-databases. 


Health Insurance Review and Agency (HIRA): The HIRA database contains 
medical claims data for the entire Korean population as a result of NHIS. 


List of sources 
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[2 


Ks 


[3 


Ku 


[4] 
[5] 
[6] 


[7] 


[8] 


The World Bank. (2019). Total population. Retrieved from: 
https://data.worldbank.org/indicator/SP.POP.TOTL?view=chart 

South Korea — The World Factbook. (2019). Retrieved from: https://www.cia.gov/the-world- 
factbook/countries/ 

Kwon, S., Lee, T. & Kim, C. (2015). Republic of Korea health system review. Asia Pacific observatory 
on public health systems and policies, Health systems in transition series, 5 (4). Retrieved from: 
https://apps.who.int/iris/bitstream/handle/10665/208215/9789290617105_eng.pdf?sequence=1&isAllo 
wed=y 

OECD Statistics. (2019). Health Expenditure and Financing. Retrieved from: 
https://stats.oecd.org/Index.aspx?DatasetCode=HEALTH_STAT# 

Republic of South Korea. (2011). Personal Information Protection Act. Retrieved from: 
http://koreanlii.or.kr/w/images/0/0e/KoreanDPAct2011.pdf 

Lee, D. Park, M.,Chang, S., & Haksoo K. (2019). Protecting and Utilizing Health and Medical Big Da- 
ta: Policy Perspectives from Korea. Healthcare Informatics Research 2019; 25(4). Retrieved from: 
https://synapse.koreamed.org/articles/1 136692 

Seong, S., Kim, Y., Park, S, Khan, Y., Kim, H., Park, J., Kang, H., Do, C., Song, J., Lee, E., Ha, S., 
Shin, S., & Jeong, S. (2017). Cohort profile: the National Health Insurance Service-National Health 
Screening Cohort (NHIS-HEALS) in Korea. BMJ Open 2017; 7: e016640. Retrieved from: 
https://bmjopen.bmj.com/content/7/9/e0 16640 

OECD. (2015). Health data governance: Privacy, monitoring and research. OECD Health policy stud- 
ies, OECD Publishing, Paris. Retrieved from: https://doi.org/10.1787/9789264244566-en 


Republic of Korea 


NHIS & NHIDB 


A database which gathers beneficiary health and health care data 


Data content 

NHIS includes data from all three types of health insurances in the Republic of Korea — 
NHIS, Medical Aid Program, and LTIC. It includes data from several sub-databases. 
This includes data on: 1) patient sociodemographics, insurance, and health check-up 
Info, 2) diagnosis, 3) encounters, and 4) medical utilization, including prescriptions 


Isthe data structured? At what level is the data aggregated? 
Yes At the regional and national level 


Isthe data checked or cleaned? 
N/A 


Who collects the data? 
The NHIS itself collects 
the data, supervised by 
the Ministry of Health 


i > 
and Welfare Isthe data linkable? 


Yes, using a unique ID on the NHID platform 


Data collection 
Data linkage 
and cleaning 


Where is the data located? Who owns thedata? 


NHIS has two big data The NHI 

analyses centers for analysis Who performs the data linkage? 
a and provision of public data, The NHI, on the NHID platform, can link NHIS data to HIRA 
© seen headquarter data, government-owned national surveys and registries, 
ro) and/or hospital lab data 
TA Who has access to data? 
& How long is the data stored? NHIS data is available to those with academic o 
E N/A or public policy affiliations ee 


What is the process for acquiring access? How is the data used for 
The NHI Corporation operates a review committee to research purposes? 
review and decide on the provision and use of NHI Research purposes include 
data. There are 2 ways to access data: analysis of adherence and 
1. Access raw data by visiting 1/2 research centers persistence, prescribing 
through customized DB provided in “data analysis patterns, healthcare 
room” in the NHIC; utilization, burden of disease, 
2. Through sample cohort datasets in sharable format outcomes and adverse 


events, as well as for policy 
How long does it take to become available? evaluation 


N/A 
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Republic of Korea 


HIRA 


The HIRA database is primarily a reimbursement claims database for providers within the 
Korean health system 


Data content 
The HIRA database contains medical claims data for the entire Korean population as a O 
result of the NHI system. This includes: information on diagnosis and status of outpatient: 

and inpatients; information related to drugs, e.g., name, dosage, prescription date and 

periods, and method of administration; information on the use of laboratory and imaging tests. | 
There are also data on patient age, gender, diagnosis, and lists of prescribed medicines 


Isthe data structured? At what level is the data aggregated? 
Yes At the regional and national level 


Isthe data checked or cleaned? 
N/A 
Who collects the data? 


HIRA Is the data linkable? 


Yes, linkable to other data sources, including 
NHIS data, national surveys and registries, etc. 


Data collection 
Data linkage 
and cleaning 


Whereis the data located? Who owns the data? 
In a data warehouse (DW) HIRA and NHIS 
Who performs the data linkage? 
The NHIS 
Who has access to data? 
i Raw data available for academics, government agencies, 
claims are removed. Plans to E 
expand datastoiage to 10 and the private sector. The scope of raw data 
provided is more limited to those in the @ 


ears are underwa £ 
y y private sector dm 


How long is the data stored? 
A 5-year period, after which 
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What is the process for acquiring access? How is the data used for 

There are 3 ways to access data: research purposes? 
Access raw data by visiting 1/7 research centers or Research purposes include 
remotely. Review process at HIRA required analysis of adherence and 
HIRA offers 4 types of patient samples. No review persistence, prescribing 
process required patterns, healthcare 
Summary statistics related to healthcare services utilization, burden of disease, 
(e.g., expenditures, utilization) are publically outcomes and adverse 
available via big data open system events, as well as for policy 

How long does it take to become available? EN evaluation 


N/A 
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United Kingdom 


United Kingdom (GBR) 


Population 66,488,991 1 
Administrative struc- Parliamentary constitutional monarchy 2 
ture of country 
Jurisdiction of health GBR is mainly a devolved matter, in that Scotland, Wales 3,4 
policy and Northern Ireland make their own decisions about the way in which 
health services are organized. The devolved administrations set health 
policy in these jurisdictions. Health policy for NHS England is decided by 
the United Kingdom government directly. 
Current health ex- e 10.2% of GDP 5 
penditure (CHE) and e 4,5000.1 USS PPP 
per capita health ex- 
penditure 
Share of spending paid | 15.9% 5 
out-of-pocket (OOP) at 
point of use ( % CHE) 
Type of health insur- Healthcare financing in the UK is primarily derived from government fund- 3,4 
ance and main sources | ing, with some private sources. 
of financing (taxation; | National Health Scheme (NHS): The national health system of GBR is fi- 
statutory contribu- nanced mostly through general tax revenue, with a smaller portion com- 
tions; pri- ing from an automatic payroll tax for insurance contributions. NHS also 
vate/voluntary health receives income from copayments. 
oie Voluntary, private health insurance (PHI): Private insurance in GBR varies 
7 from coverage for specific conditions to broader packages. It is primarily 
employer-based private medical insurance, but individuals also purchase 
plans. 
OOP payments: OOP costs are mainly due to cost-sharing of prescriptions 
medicines and medical appliances or direct payments for services not 
covered by the NHS or for private treatment. 
Extent of coverage by NHS: Coverage is universal through NHS for all legal residents. 3,4 
insurance type VHI: Approximately 11 % of the population has VHI for quicker access to 
services. 
Organization of health 
service delivery 
Primary care - Yes 3 
gatekeeper func- 
tion? 
Specialist outpa- Most outpatient specialist consultations are performed in hospitals; some 3 
tient care take place in general practices. 
Payment mecha- Hospital care: Hospitals in GBR are mostly public and payment is made 3,4 
nisms mostly through case-based payments. Budgets are used to cover mental 
health, education, and research and training; these also include physician 
and drug costs. 
Primary care: Primary care is delivered primarily via private GPs, with 
some NHS-owned practices. With the latter, physicians are salaried. With 
the former, care is paid through a mix of capitation for essential services, 
fee-for-service and pay-for-performance. An increasing number of GPs 
playing a substitute role in private practices are salaried as well. 
Specialist care: Most specialists are salaried at NHS hospitals. Hospitals 
are paid for outpatient consultations at nationally determined rates. GPs 
“with specialist interests” in private practice offer specialist consultations 
on a per-session or fee-for-service basis. 
Examples of health e The Data Protection Act 2018 6,7 


data protection laws 


e The Health Service (Control of Patient Information) Regulations 
2002 
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United Kingdom 


Example of health data 
strategies 


e The future of healthcare: our vision for digital, data and technology 
in health and care (2018) 

e NHS Digital Data and Information Strategy (England, 2016) 

e A Health and Biomedical Informatics Research Strategy (Scotland, 
2015) 

e Joined up data for better decisions: A strategy for improving data 
access and analysis (Scotland, 2012) 


8, 9, 
10, 11, 
12 


Index of technical in- 
frastructure 


The UK overall has good health data availability and accessibility: 


England has high data availability but reports lower population coverage 
in data and use of data for system quality/performance reporting (OECD’s 
Key national dataset availability, maturity and use score: 5.03/7.0). 


Scotland has strong health information systems and reports high use of 
data for quality/performance reporting and for research; population cov- 
erage, however, is limited as is accessibility of some data (OECD’s Key 
national dataset availability, maturity and use score: 5.58/7.0). 


13 


Relevant actors 


Department of Health and Social Care (DHSC): Stewards the system and 
sets the overall strategic direction for health, public health and adult social 
care in England. 


NHS Digital: Formerly, Health and Care Information Centre (HSCIC) estab- 
lished with new powers and responsibilities in relation to data in 2005, 
NHS Digital it is the national provider of information, data and IT systems 
for commissioners, analysts and clinicians in health and social care in Eng- 
land; it provides digital services for the NHS and social care. 


Health and Social Care Transparency Panel (HSCTP): Is the transparency 
board for the DHSC; gives advice on making data more transparent and 
available. 


Clinical Practice Research Datalink (CPRD): a research service supporting 
retrospective and prospective public health and clinical studies. CPRD is 
sponsored by the Medicines and Healthcare products Regulatory Agency 
and the National Institute for Health Research (NIHR), as part of the DHSC. 
It collects anonymised patient data from a network of GP practices across 
the UK, which are then linked to other health related data to provide a 
longitudinal, representative UK population health dataset. 


electronic Data Research and Innovation Service (eDRIS): a single point of 
contact associated with the Edinburgh International Data Facility in Scot- 
land for those in the research community who want to link datasets on 
Scottish healthcare with other public sector administrative datasets 
Scottish Primary Care Information Resource (SPIRE): a service which ena- 
bles information to be requested from GP practice records and collected 
centrally to produce statistics for Scotland. 


3, 4, 
14, 15, 
16, 17 
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List of sources 
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[6] 
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[13] 
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[15] 
[16] 
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The World Bank. (2019). Total population. Retrieved from: 
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United Kingdom — The World Factbook. (2019). Retrieved from: https://www.cia.gov/the-world- 
factbook/countries/ 
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CPRD 


CPRD provides anonymized UK Electronic Health Records (EHRs) to researchers within 
academic, regulatory, and pharmaceutical organizations worldwide to support observational 
public health research 


Data content 
Primary care data includes files on the 1) Patient, 2) Practice, 3) Staff, 4) Consultation, O À 


5) Clinical details, 6) Referrals, 7) Immunizations, 8) Tests, 9) Prescriptions and devices 
Linked datasets includes 1) Hospital Episode Statistics (HES) Admitted Patient Care, 2) HES | | 


Outpatient data, 3) HES Accident & Emergency data, 4) HES Diagnostic Imaging dataset, 
5) Death registration data, 6) Cancer data, 7) Mental health dataset, 8) Small area level data 


Is the data structured? At what level is the data aggregated? 
Yes N/A 
= 
Q Who collects the data? c Is the data checked or cleaned? 
D Primary care data is op ‘= Yes, NHS Digital generates flags for linked data to 
v collected by GPs. $ =] indicate the validity of data and enable cleaning 
© Afterwards, software c 5 
o suppliers de-identify = Oo Is the data linkable? 
= and pseudonymize data fh Oo Yes, linkable by NHS number for English GP 
A and submit itto CPRD A = practices who have consented to participate 
Who owns the data? 
Where is the data located? N/A 
CPRD. Following linkage, de- Who performs the data linkage? 
identified data flows directly NHS Digital’s Health and Social Care Information Centre 
A from NHS Digital to CPRD (HSCIC) performs the data linkage 
© Who has access to data? 
9 How long is the data stored? The CPRD provides access to patient level data for health 
i) Data collection began in research depending on approval by Independent 
x 1987 and data continues to Scientific Advisory Committee (ISAC). In general, ® 
A grow only researchers carrying out public health pe] 
studies can receive data 


What is the process for acquiring access? How is the data used for 
All requests for research use must be submitted to research purposes? 
ISAC Secretariat using the Protocol Application Form CPRD data are used 
worldwide for observational 
How long does it take to become available? and EHR-enabled public 
Data are collected by practices and usually uploaded to health studies. Over 2,000 
the CPRD secure servers on a monthly basis. The date peer-reviewed publications 
of last data collection corresponds to the date of the informing clinical and drug 
last data upload from each practice. Monthly safety guidelines and best 
builds of the primary care dataset are EN practice have been published 
made available for researchers to date 
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eDRIS 


eDRIS aims to support researchers and policy analysts by advising which health and 
administrative datasets are available, their data controllers and locations, strengths and 
weakness (in terms of content and data quality) and the processes required to gain access 


rant OA 
Any publicly held data in Scotland can be requested for research, planning 
and evaluation projects. The Information Services Division (ISD) is a division 
of NHS National Services Scotland (NHS NSS) 
Is the data structured? At what level is the data aggregated? 
Yes N/A; varies by dataset 
(= 
oO 
+ U = Is the data checked or cleaned? 
D Who collects the data? ~ =) N/A; varies by dataset 
= Different actors collect x 5 
O i co 
O E > E on == E Is the data linkable? 
H ee HE ge Yes, data is linkable through the Community 
A A = Health Index 
Who owns the data? 
Whereis the data located? Shared between the NHS Boards and the ISD 
ISD holds most source Who performs the data linkage? 
datasets centrally A trusted third party. A ‘Population Spine’ is used as an 


intermediary linkage tool and contains the personal 

E identifiers of all individuals in Scotland who have been in 
How long is the data stored? contact with NHS Scotland 

Data is stored as per study Who has access to data? 

protocol, then keptin the Approved applicants/researchers have ® 
eDRIS archiva for some tme; to undergo information governance training = 
after which it is destroyed and have the necessary approvals 


Data storage 


What is the process for acquiring access? How is the data used for 
eDRIS advises on process on a case-by-case basis. research purposes? 
Some require applications and special permissions. N/A 

Ethical approval is required unless exempted. Once all 

approvals are granted, the eDRIS Research Coordinator 

arranges for data to be extracted and linked 


How long does it take to become available? 
ISD holds information centrally that is updated 
on a monthly basis and provides NHS Boards EN 


with local extracts 
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SPIRE 


An approach to bring together primary care data from separate practices, which can be then 
linked to other datasets to better understand the health of the Scottish population in order 
to manage health and social care services 


Data content C) È 
SPIRE is not strictly a linkage initiative, but has the potential for linkage at 

the Information Services Division (ISD — see eDRIS). 

Data includes 1) Patient details, 2) Findings and procedures (Read V2 Codes), 

3) Medicines, 4) Utilization, and 5) Diagnoses 


At what level is the data aggregated? 
Multiple levels, including GP, practice, cluster, 
locality and national 


Isthe data structured? 
Varies; yes and no. Only 
structured data are 


made available for Isthe data checked or cleaned? 
research purposes i N/A 


Is the data linkable? 

Yes, through the Community Health Index. 
Personally-identifiable data is pseudonymized 
before it leaves the practice 


Who collects the data? 
GPs collect the data 


Data collection 
Data linkage 
and cleaning 


Where is the data located? Who owns the data? 

GPs store the data, and GPs 

SPIRE uses software to Who performs the data linkage? 

extract data from each Software supplied by MSDi is used to extract data at each 
practice practice. Practices have information about the purpose 
How long is the data stored? and content of each data extract before deciding whether 
Normally for six months to opt in. Once extraction occurs, data is transferred 

after extraction or for the securely to NSS using secure communication links 


appropriate duration to Who has access to data? 
process requests NHS workers and researchers aa 
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What is the process for acquiring access? How is the data used for 
Local reports and queries are sent to the practice via research purposes? 
eLinks and are run within the GP practice only. All N/A 

requests for data extraction are scrutinized, agreed and 

prioritized by the SPIRE Strategy & Oversight Group. No 

data are extracted until the practice opts in 


How long does it take to become available? 
An NSS analyst will contact the requestor 
for next steps after receipt of the form, EN 


normally within two weeks 
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United States (USA) 


United States 


Population 327,167,434 1 
Administrative struc- Constitutional federal republic 2 
ture of country 
Jurisdiction of health | The health sector is characterized by relatively weak planning and 3 
policy regulatory systems and power is divided between the federal, state 
and local governments and a myriad of private organizations. 
Current health expendi- | 16.8 % of GDP (2016) 4 
ture (CHE) and per capi- | 19,948.5 USS PPP (2016) 
ta health expenditure 
Share of spending paid 11.3 % (2016) 4 
out-of-pocket (OOP) at 
point of use ( % CHE) 
Type of health insur- The USA is composed of a mixed financing system, including public and 3,5 
ance and main sources private insurers. 
of financing (taxation; Medicare: One main public insurer is Medicare, which covers individuals 
statutory contributions; | aged 65 and older and some disabled individuals. It is financed through a 
private/voluntary payroll tax, premiums and federal tax revenue. 
nea ale alcatel PEE Medicaid: Another public insurer is Medicaid, which provides insurance to 
miums; OOP; etc.) ] otis 7 a 
some low-income individuals. It is financed by state and federal tax reve- 
nue. 
Other public insurances in the USA: There are also additional smaller pub- 
lic insurers for military, veteran, and Native Americans. 
Commercial, private insurance: This is a primary form of insurance cover- 
age in the US and is financed by employer and/or individual. For those 
without employment coverage, state-level exchanges provide income- 
based subsidies and incentives (e.g., tax breaks). Supplementary insurance 
for Medicare financed by individual also exists. 
OOP payments: Cost-sharing varies from plan to plan. Copayments are 
required for the most part for physician visits, hospital services and pre- 
scription drugs. There is a cap on OOP spending at USD6,600 annually for 
individuals with private insurance. 
Extent of coverage by Public insurers: In total, public insurers in the USA cover 37.7 % of total 3,5 
insurance type insured population, with Medicare covering 17.2 % and Medicaid 19.3 % 
population. 
Private insurers: 67.2 % of total insured population is covered by private 
insurances. Of this, 56 % come from employer-based insurance and 16 % 
from direct-purchase coverage. 
Uninsured: 8.8 % of the population of the USA 
Organization of health 
service delivery 
Primary care - No, though some insurance programs require general practitioners (GPs) to 3,5 
gatekeeper play a gatekeeping role. Private plans use narrow networks of providers, 
function? however, which limit patient choice. 
Specialist out- Specialist outpatient care is provided in both hospitals and private practic- 5 
patient care es. 
Payment Hospital care: Hospitals are mostly not-for-profit, with some public and for- 3 
mechanisms profit facilities. Outpatient hospital care is paid on a fee-for-service basis. 


Primary care: Delivered by private GPs and other physicians. It is paid pri- 
marily via fee-for-service. Capitation is used in some private plans. Limited 
use of quality-based payments in the public and private sector. Further 
financial incentives are available (e.g., shared savings), and patients often 
pay copayments for doctor’s visits depending on insurance plan. 
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Specialist care: Specialists in both hospitals and private practices are mostly 
paid fee-for-service. 


Examples of health data | The Health Insurance Portability and Accountability Act (HIPAA) 6 
protection laws 

Example of health data e The Health Data Initiative 6 
strategies e The 2009 Health Information Technology for Economic and Clinical 


Health (HITECH) Act 
e The Promoting Interoperability proposed rule 


Index of technical infra- | The USA has somewhat limited health data information systems, reporting 7 


structure limited accessibility and population coverage (only 13 % cover 80 % or more 


of the population) (OECD’s Key national dataset availability, maturity and 
use score: 4.11/7.0). 


Relevant actors US Department of Health and Human Services (HHS) and associated agen- 3 


cies (e.g., Centers for Medicare and Medicaid Services (CMS), Centers for 
Disease Control and Prevention (CDC), National Institutes of Health (NIH), 
US Food and Drug Administration (US FDA)) 


Providers and commercial insurers also have a strong influence within the 
USA’s health system 


List of sources 


[1] 
[2] 
[3] 


[4] 
[5] 


[6] 
[7] 
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United States 


CancerLinQ 


A health IT platform that connects and analyzes real-world cancer care data from many data 
sources 


Data content: 

CancerLinQ operates three databases and includes data about the 1) Patient, A 
2) Practice / provider, 3) Encounters, 4) Diagnosis, 5) Pathology, 6) Staging, 

7) Vitals, 8) Assessments, 9) Laboratory tests, 10) Imaging / radiology reports, 

11) Treatment plans, 12) Medications ordered, 13) Medications administered, [| 
14) Radiation therapy, 15) Surgery, 16) Outcomes, 17) Clinical trial enrollment 


Is the data structured? At what level is the data aggregated? 
Varies; yes and no Based on cancer type 


Is the data checked or cleaned? 
No, CancerLinQ Discovery (CLD) is provided “as 
is”, with no guarantee for accuracy/completeness 


Who collects the data? 
A community of 
practices that treat 
cancer patients and 


i ? 
have a partnership with Is the data linkable? 


Only for subscribers, who can access identifiable 


Data collection 
Data linkage 
nd cleaning 


EAEETEINE patient information in the clinical database 
Who owns the data? 
Where is the data located? Once collected, the data is owned by CancerLinQ. Patients 
CancerLinQ hosts three must opt out if they do not want their information added 
databases — two for to the database 
subscribers (identified and Who performs the data linkage? 
de-identified) and one for N/A 
researchers (de-identified) Who has access to data? 


CancerLinQ subscribers. Non-commercially funded e 


How long is the data stored? researchers who request access are limited to 


approved research question 


Data storage 


What is the process for acquiring access? How is the data used for 
. Researcher submits request research purposes? 
. Initial review of data sufficiency (if data is available 1. Custom analytics reports 
in CancerLinQ and fit for purpose) 2. Controlled, cloud-based 
. Full review of proposal from Research and access to curated, 
Publications Committee aggregated, de-identified 
. Decision on request made data on specific diseases 


or patient populations 
How long does it take to become available? 
6-8 weeks. Data access is terminated EN 


once a project is complete 
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CMS Data 


The Centers for Medicare & Medicaid (CMS) hosts over 400 databases with information 
related to the beneficiaries of and providers for CMS programs 


Data content 

CMS databases can contain socio-economic demographic, health and health care C) A 
data. Many of these databases are available as public use files (PUFs) as aggregated 

data. Others are de-identified individual level data with a limited data set (LDS). 

The last category is research identifiable files (RIFs), which are customizable [|] 


and contain individual level data 


At what level is the data aggregated? 
Public use files are nationally aggregated, 
individual level data are not aggregated 


Is the data structured? 
Varies; yes and no 


Is the data checked or cleaned? 
N/A; varies depending on dataset 


Who collects the data? 
Varies based on the 
dataset; ultimately 


i ? 
collected by CMS Is the data linkable? 


Yes, CMS databases contain several linkable 
identifiers (e.g., patient, geography, provider) 


Data collection 
Data linkage 
and cleaning 


Where is the data located? 


Varies based on database. Who owns the data? 
CMS has central and local N/A; varies depending on dataset 


database administration Who performs the data linkage? 

Generally the researcher performs the data linkage 

Who has access to data? 

; FR Varies based on dataset. PUFs are available to anyone, 
How long is the data stored? 9] other datasets with identifiable information O 
Varies based on database require an application. 


What is the process for acquiring access? How is the data used for 
Many databases are available to anyone: data.cms.gov. research purposes? 

For identifiable data, CMS has a contract with ResDAC CMS data is widely used in 
to facilitate data access requests. Researchers submit health systems research to 
application, which CMS privacy board reviews. After understand information 
approval, researcher pays for data and CMS prepares it about enrollment, payment, 
How long does it take to become available? quality, program, and more 
Some PUF data are available relatively quickly (e.g., for Medicare and Medicaid 
20XX Medicare Beneficiary summary file 

available in 20XX+1). ResDAC data requests EN 


take around 3-5 months 
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Kaiser Health Connect 


The Kaiser Health Connect system, built on an Epic product, integrates the clinical EMR with 
appointments, registration, and billing. Kaiser Permanente is the largest integrated delivery 
system and Kaiser Health Connect is the world's largest private clinical information system 


Data content 
Kaiser Health Connect includes two main items: MyChart (the patient portal) and C) A 


EpicCare (clinical data). Clinical data collected includes 1) scheduling, 2) registration, 
3) clinicals, and 4) billing data for both outpatient and inpatient care and |] 


5) admission, discharge, and transfer, 6) pharmacy, 7) emergency department, 
and 8) operating room data for inpatient care 


At what level is the data aggregated? 
18 instances of Epic and 8 regions aggregate to 1 
fully integrated system 


Is the data structured? 
Varies; yes and no 


Is the data checked or cleaned? 
Yes, some quality checks include profiling tools 


Who collects the data? such as SAS Dataflux 


Kaiser Permanente staff 


and members Is the data linkable? 


Yes, data is linkable using a patient identifier. 


Data collection 


Data linkage 
and cleaning 


. Who owns the data? 
Whereis the data located? Kaiser Permanente staff and members 
Kaiser Permanente data Who performs the data linkage? 
warehouses Linkage is done automatically using the patient identifier. 


Clinicians can review a patient's chart from their home 

B region, allowing a measure of linkage across all Kaiser 
FR long is thg data storedi regions to facilitate care delivery. Encounters outside of 
Use of electronic health Kaiser can also be integrated into the patient record | 
records began over 40 years Who has access to data? 

ago; data storage continues Kaiser Permanente staff and members Pee 


Data storage 


What is the process for acquiring access? How is the data used for 

The data is available for Kaiser Permanente research purposes? 

Researchers and a subset of data is available for Kaiser Permanente 

collaborating partners. A committee reviews requests Researchers can use the data 

from entities as collaborating partners, in areas of to conduct studies. 

"mutual interest." Collaborating partners can access a Otherwise, only 

subset of data to answer research questions organizations that require 
PHI for purposes of 

How long does it take to become available? treatment or insurance can 

N/A EN request information 
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PCORnet 


United States 


PCORnet, the National Patient-Centered Clinical Research Network, supports clinical 
research through large amounts of health data and patient partnerships. Its “Front Door” 


provides an external online access 
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Data content: 


Data includes 1) demographic, 2) enrollment, 3) encounter, 4) diagnosis, 5) procedures, C) A 
6) vital signs, 7) prescriptions filled, 8) lab results, 9) condition, 10) responses to 


patient-reported outcome questionnaires, 11) provider orders for medication, 
12) patients enrolled in PCORnet trials, 13) death, 14) medication administration by 
providers, 15) provider, 16) clinical trials data 


Data collection 


Data storage 
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Is the data structured? 
Varies; yes and no 


Who collects the data? 
Partner networks, 
including providers, 
patients, and payers. 
PCORnet uses a 
Common Data Model 
(CDM) 


Where is the data located? 
Data remain local and secure 
behind the firewalls of each 
partner 


How long is the data stored? 
N/A; data storage 
responsibility of each 

partner 


What is the process for acquiring access? 

When a researcher submits a research question 
through an online access point called the “Front Door,” 
that question is reviewed by the Coordinating Center, 
which taps data of the individual Partner Networks 
through a specialized query format. A response is 
generated, allowing the researcher to ask the same 
question to many all at the same time 


How long does it take to become available? EN 
About 12-15 weeks 


Data linkage 
and cleaning 


point to researchers to use this data 


E 


At what level is the data aggregated? 
At the national level based on the CDM 


Is the data checked or cleaned? 
Yes, by administrators. Foundational data quality 
is also checked through data curation 


Is the data linkable? 
Yes, the network uses a CDM without real 
identifiers so each site creates pseudo-identifiers 


Who owns the data? 

PCORnet uses a Distributed Research Network (DRN). 

Each partner network securely collects and stores data in 

a standardized way within their own institutions. The 

Patient-Centered Outcomes Research Institute oversees 

PCORnet 

Who performs the data linkage? 

The partner networks enter data into a CDM so the 

linkage will work a 

Who has access to data? 

Each partner network a] 
How is the data used for 

research purposes? 


Potential investigators, 
patient groups, healthcare 
organizations, clinicians, 
government, industry 
scientists, and sponsors can 
use PCORnet for the conduct 
of more efficient clinical 
research 


SEER-Medicare 


United States 


SEER-Medicare links two datasets: the SEER dataset of the National Cancer Institute (NCI) 
and Medicare data to provide detailed information about Medicare recipients with cancer 


Data content 


The SEER dataset has data from 18 registries across the US for persons with cancer C) A 
and Medicare data contains enrollment and claims data for Medicare recipients 


1) demographic information, 2) information about the cancer, 3) Medicare enrollment 


(population aged 65 and older). Combined, the two linked datasets include | 


data, and 4) data derived from bills submitted by providers and processed by Medicare 


Isthe data structured? 
Yes 


Who collects the data? 
CMS collects Medicare 
data, 18 cancer 
registries collect cancer 
data 


Data collection 


Where is the data located? 
SEER registries and CMS. 
Once the data is requested 
for use, a contractor creates 
the data files 


How long is the data stored? 
Earliest data available from 
1973. Standard data 
retention time period for 
researchers is 5 years 
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Data linkage 
and cleaning 


At what level is the data aggregated? 
The data is aggregated from the cancer registries 
in defined geographic areas 


Is the data checked or cleaned? 
Yes, Quality is maintained through contractual 
agreements with regional registries and editing 


Is the data linkable? 
Yes, using unique personal identifiers 


Who owns the data? 

SEER registry Pls and CM5. They hold NCI responsible for 
tracking the use and location of all released SEER- 
Medicare datasets 

Who performs the data linkage? 

IMS, a programming contractor of NCI 

Who has access to data? 

Release of SEER-Medicare data is project specific. O 
Researchers must have an approved application in 

order to access these files sa 


What is the process for acquiring access? How is the data used for 
Complete an application, submit a data use research purposes? 
agreement, receive Institutional Review Board It is used for an array of 
approval, and request restricted variables. The epidemiological and health 
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researcher must pay costs based on data request services research about 
How long does it take to become available? cancer care, including costs 
About 7-15 weeks, depending on variables. Linkages of careand use of tests and 
are done every 2 years, most recently in 2017, with treatment 


cancer incidence data through 2015 and 
Medicare claims data through 2016 EN 
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